chatGPT
192
2024-08-06
太原理工2024软件工程招60个班,近2000人,冲上热搜
这一届软件工程专业的学生占了 1/4,同班同学都是老乡。都知道计算机专业火热,没想到竟然这么火。刚刚,「2024 太原理工大学(211)软件工程招 60 个班,接近 2k 人」的这条消息登上知乎...
214
2024-08-05
细数RAG的12个痛点,英伟达高级架构师亲授解决方案
检索增强式生成(RAG)是一种使用检索提升语言模型的技术。具体来说,就是在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过程。这种技术能极大提升内容的准确性和相关性,并能有效缓解幻觉问题,提高知识更新的...
259
2024-08-05
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗?不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只...
395
2024-08-04
小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++
在当前 AI 领域,大语言模型采用的主流架构是 Transformer。不过,随着 RWKV、Mamba 等架构的陆续问世,出现了一个很明显的趋势:在语言建模困惑度方面与 Transformer 较量的循环大语言模型正在快速进...
183
2024-08-04
阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net 架构 ,主要侧重于合成有限时长(通常约为两秒)的视频,并且分辨率和纵横比受到固定限制。Sora 的出现打破了这一限制,其采用 Diffusion Tra...
文章分类
联系我们
联系人: | 羊毛君 |
---|---|
Email: | soft850207@gmail.com |
网址: | ai.weoknow.com |