chatGPT
199
2024-07-26
算法、系统和应用,三个视角全面读懂混合专家(MoE)
LLM 很强,而为了实现 LLM 的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最近,各家科技公司提出的新一代大模型不约而同地正在使用混合专家(Mixture of Ex...
235
2024-07-26
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
在 ChatGPT 走红之后,本着「打不过就加入」的心态,很多职场人学起了 AI。但遗憾的是,不少人走了弯路,甚至还被某些「199」的课程割了韭菜。其实,学 AI 这事儿并不难。读文章、看视频、啃论文都是很好的学习方式。...
196
2024-07-25
彻底改变语言模型:全新架构TTT超越Transformer,ML模型代替RNN隐藏状态
从 125M 到 1.3B 的大模型,性能都有提升。难以置信,这件事终于发生了。一种全新的大语言模型(LLM)架构有望代替至今在 AI 领域如日中天的 Transformer,性能也比 Mamba 更好。本周一,有关 ...
218
2024-07-25
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
快准备好你的 GPU!模型卡来源:https://pastebin.com/9jGkYbXY参考信息:https://x.com/op7418/status/1815340034717069728https://x.com...
207
2024-07-25
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
文章分类
联系我们
联系人: | 羊毛君 |
---|---|
Email: | soft850207@gmail.com |
网址: | ai.weoknow.com |