News
在《The Diary of a CEO》最新一期节目中,ARK Invest 创始人、掌管 300 亿美元资产的‘女股神’ Cathie Wood(凯茜·伍德),用三组数据划出 AI 落地的爆发路径 北京时间 6 月 5 日,在《The Diary ...
对于o3-mini和o4-mini,使用CoT提示相比要求模型直接回答提升非常少,对于Gemini 2.5 Flash更是所有指标全面下降。
在Dwarkesh Patel主持的节目中,Anthropic的Sholto Douglas、Trenton Bricken等人,一起讨论了Claude 4是如何思考的。 最早语言模型的调优方法是RLHF(Reinforcement Learning ...
美国艺术与科学院与美国国家工程院(NAE)双院士、斯坦福大学教授、NLP大牛Chris Manning,如获至宝,甚至说Nathan Lambert的这两项工作「救活了DPO」。
Cursor 是基于 Visual Studio Code(VS Code)开发的衍生版本,最早于 2023 年发布预览版。它是当前快速演进的一批 AI 编程工具之一,其竞争者包括 VS Code + GitHub ...
这一构造体现了一个通用原则:任何具有结构化记忆和高效分块并行原语(chunkwise-parallel primitive)的线性注意力机制,都可以通过将其注意力掩码与对数线性变体组合,扩展为对数线性形式。
在声明中,Challenger,Gray&Christmas高级副总裁Andrew Challenger表示:「关税政策、资金缩减、消费疲软及整体经济悲观情绪,正对企业用工构成巨大压力。企业正在削减开支、放缓招聘并频发裁员通知。」 ...
AI安全研究机构FAR.AI联合创始人Adam Gleave透露,仅用6小时,研究人员Ian McKenzie就成功诱导Claude 4生成了长达15页的化学武器制作指南。 矛盾的是,Anthropic虽自称将AI安全置于首位,并把Claude ...
RNN太老,Transformer太慢?谷歌掀翻Transformer王座,用「注意力偏向+保留门」取代传统遗忘机制,重新定义了AI架构设计。全新模型Moneta、Yaad、Memora,在多个任务上全面超越Transformer。这一次,谷歌不是调 ...
很多人讨论通用人工智能(AGI)和超级人工智能(ASI)的时间表。AGI指在人类主要领域达到专家水平,ASI则是通过自我改进快速超越人类。
美国初创公司Starcloud计划于今年8月发射一颗搭载英伟达H100芯片的卫星,尽管其计算能力有限,但将成为轨道上最强大的计算机。该公司还计划在太空中建造全球首个吉瓦级数据中心,由巨型太阳能阵列供电。
最近,在欧洲 AI 创业地图上,一笔 1300 万美元的种子轮融资格外醒目:没有发布产品、没有用户数据、甚至没有一行可供调用的 API,SpAItial,仅凭一段展示“文本生成 3D 房间”的短视频,就拿到了 ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results