Llama Revolvers

About 80,000,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
如何看Meta最新开源的Llama3.3-70B-Instruct，它和之前的Llama …
Llama 3.3-70B-Instruct在多语言支持方面表现出色，尽管目前不支持中文，但它支持多达8种语言的文本输入和输出，这为全球开发者提供了广泛的应用可能性。随着社区的不断壮大和技术 …
zhihu.com
https://www.zhihu.com › question
做大模型RL后训练，用huggingface/trl还是用llama-factory？
14B模型，我用llama-factory做过reward model的lora训练和PPO的lora训练，具体训练脚本可以看我的两篇文章。 PPO训练实践——基于llamafactory训练框架和 RewardModel 训练实践—— …
zhihu.com
https://www.zhihu.com › question
为什么都在用ollama而lm studio却更少人使用? - 知乎
3. 还有一点，ollama是llama.cpp实现模型推理，模型小，速度快。 4. 还有，ollama提供11434端口的web服务，重要的是还兼容openai的端点接口，可以和各种前端配合，比如ollama自己open …
zhihu.com
https://www.zhihu.com › question
草泥马是alpaca还是llama，两者的区别主要是什么？ - 知乎
Final复习中有一门课叫做introduction to livestock 它的final包括三部分其中part1是breed identification 有Camelids。 Camelids主要包括双峰驼单峰驼原驼美洲驼羊驼小羊驼骆 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
十分钟读懂旋转编码（RoPE） - 知乎
旋转位置编码（Rotary Position Embedding，RoPE）是论文 Roformer: Enhanced Transformer With Rotray Position Embedding 提出的一种能够将相对位置信息依赖集成到 self-attention 中 …
zhihu.com
https://www.zhihu.com › question
Deepseek为什么蒸馏llama和Qwen模型,而不用671B满血 ... - 知乎
Feb 17, 2025 · 而DeepSeek就是用自己的这个DeepSeek-R1的671B的大模型当作教师模型来训更小的llama和Qwen等“学生”模型。对“蒸馏”想深入了解的话，可以看这篇综述：
zhihu.com
https://www.zhihu.com › question
本地部署大语言模型，如llama 3都用于做什么？ - 知乎
Apr 19, 2024 · 本地部署大语言模型，如llama 3都用于做什么？现在都有网页版语言大模型如Claude、chatgpt、gemini、copilot可以使用。为什么还在本地部署？显示全部关注者 32
zhihu.com
https://www.zhihu.com › question
Llama-factory 怎样从 Checkpoint 继续训练 lora？ - 知乎
Llama-factory 怎样从 Checkpoint 继续训练 lora？求助各位大佬，如果我使用Llama-factory对llama3进行了1000步Lora微调，得到了一个checkpoint-1000，然后我中断了训… 显示全部关 …
zhihu.com
https://www.zhihu.com › question
Ollama和llama.cpp什么关系，或者说有关系吗？ - 知乎
Ollama和llama.cpp什么关系，或者说有关系吗？看上去像是Ollama是对llama.cpp的封装和添加了很多内容，Ollama底层是llama.cpp吗？显示全部关注者 75 被浏览
zhihu.com
https://www.zhihu.com › question
llama.cpp里面的Q8_0,Q6_K_M,Q4_K_M量化原理是什么？ - 知乎
llama.cpp里实现了多种量化方法，下面我们来整体介绍一下，可能会存在一些理解偏差，因为官方文档实在是太少了，如果发现有错误，请不吝指教。二、llama.cpp中主要量化方法系列 1. …

Pagination
- Next
- Next