何发
文章学习-2025-1-20
文章学习-2025-1-21
文章学习-2025-1-22
文章学习-2025-1-23
文章学习-2025-1-24
文章学习-2025-1-25
文章学习-2025-1-26
文章学习-2025-1-27
文章学习-2025-1-28
文章学习-2025-1-29
文章学习-2025-1-30
文章学习-2025-1-31
文章学习-2025-2-1
文章学习-2025-2-2
文章学习-2025-2-3
文章学习-2025-2-4
文章学习-2025-2-5
文章学习-2025-2-6
文章学习-2025-2-7
文章学习-2025-2-8
文章学习-2025-2-9
文章学习-2025-2-10
文章学习-2025-2-11
文章学习-2025-2-12
文章学习-2025-2-13
文章学习-2025-2-14
文章学习-2025-2-15
文章学习-2025-2-16
文章学习-2025-2-17
文章学习-2025-2-18
文章学习-2025-2-19
文章学习-2025-2-20
文章学习-2025-2-21
文章学习-2025-2-22
文章学习-2025-2-23
文章学习-2025-2-24
文章学习-2025-2-25
文章学习-2025-2-26
文章学习-2025-2-27
文章学习-2025-2-28
文章学习-2025-3-1
文章学习-2025-3-2
文章学习-2025-3-3
文章学习-2025-3-4
文章学习-2025-3-5
文章学习-2025-3-6
文章学习-2025-3-7
文章学习-2025-3-8
文章学习-2025-3-9
文章学习-2025-3-10
文章学习-2025-3-11
文章学习-2025-3-12
文章学习-2025-3-13
文章学习-2025-3-14
文章学习-2025-3-15
文章学习-2025-3-16
文章学习-2025-3-17
文章学习-2025-3-18
文章学习-2025-3-19
文章学习-2025-3-20
文章学习-2025-3-21
文章学习-2025-3-22
文章学习-2025-3-23
文章学习-2025-3-24
文章学习-2025-3-25
文章学习-2025-3-26
文章学习-2025-3-27
文章学习-2025-3-28
文章学习-2025-3-29
文章学习-2025-3-30
文章学习-2025-3-31
文章学习-2025-4-1
文章学习-2025-4-2
文章学习-2025-4-3
文章学习-2025-4-4
文章学习-2025-4-5
文章学习-2025-4-6
文章学习-2025-4-7
文章学习-2025-4-8
文章学习-2025-4-9
文章学习-2025-4-10
文章学习-2025-4-11
文章学习-2025-4-12
文章学习-2025-4-13
文章学习-2025-4-14
文章学习-2025-4-15
文章学习-2025-4-16
文章学习-2025-4-17
文章学习-2025-4-18
文章学习-2025-4-19
文章学习-2025-4-20
文章学习-2025-4-21
文章学习-2025-4-22
文章学习-2025-4-23
文章学习-2025-4-24
文章学习-2025-4-25
文章学习-2025-4-26
文章学习-2025-4-27
文章学习-2025-4-28
文章学习-2025-4-29
文章学习-2025-4-30
文章学习-2025-5-1
文章学习-2025-5-2
文章学习-2025-5-3
文章学习-2025-5-4
文章学习-2025-5-5
文章学习-2025-5-6
文章学习-2025-5-7
文章学习-2025-5-8
文章学习-2025-5-9
文章学习-2025-5-10
文章学习-2025-5-11
文章学习-2025-5-12
文章学习-2025-5-13
文章学习-2025-5-14
文章学习-2025-5-15
文章学习-2025-5-16
文章学习-2025-5-17
文章学习-2025-5-18
文章学习-2025-5-19
文章学习-2025-5-20
文章学习-2025-5-21
文章学习-2025-5-22
文章学习-2025-5-23
文章学习-2025-5-24
本文档使用 MrDoc 发布
-
+
首页
文章学习-2025-4-23
## 第一篇文章 #### 名称:大模型领域必读论文:20 篇精选研究,非常详细收藏我这一篇就够了 #### 链接:https://blog.csdn.net/2401_84495872/article/details/144218305 #### 总结:介绍了智谱AI发布的CogVideoX技术报告,其推出首个开源商用级视频生成模型CogVideoX 2B,具有多种优势,包括生成视频长度为6秒等。还提到OpenAI无需大量人工、基于规则奖励改善模型安全行为的研究,展示了一种新颖的偏好建模方法,利用AI反馈和少量人类数据实现更好的安全行为准确性。同时,Stability AI推出的Stable Video 4D,是一种用于生成多帧和多视角一致的动态3D内容的潜在视频扩散模型,通过独特的方法实现视频帧新视角的生成。 ## 第二篇文章 #### 名称:2.2 主流大模型架构:GPT、DeepSeek、GLM、Claude、QwQ、Qwen2.5-Max等模型的比较与应用场景 #### 链接:https://blog.csdn.net/sunyuhua_keyboard/article/details/147448040 #### 总结:以Transformer架构为基础,深入分析了GPT系列、DeepSeek的R1和R2、清华大学GLM、Anthropic的Claude、阿里巴巴的QwQ以及Qwen2.5-Max等主流大模型架构。探讨了这些模型的设计理念、训练策略和应用优势,为企业选择合适的模型提供了指导,帮助读者了解各架构的原理和特点。 ## 第三篇文章 #### 名称:大模型日报 | 7 篇必读的大模型论文 #### 链接:https://blog.csdn.net/AMiner2006/article/details/144346319 #### 总结:英伟达推出LLM推理加速框架Puzzle,通过创新性地应用神经架构搜索等方式,在硬件约束条件下优化了拥有数百亿参数的模型,提高了推理吞吐量速度,同时保留了大部分原始模型功能,为大语言模型的高效部署提供了新的思路和方法。
admin
2025年4月24日 08:32
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档(打印)
分享
链接
类型
密码
更新密码