封面提示词:Light diffraction Rayleigh, science, Perfect wallpaper --chaos 100 --ar 16:9 --style raw --profile 1qiat9p --stylize 1000
上周精选✦
Open AI 发布了 Deep Research 深度研究功能
Open AI 发布了 Deep Research 深度研究能力,支持搜索网页、分析文件然后用 5-30 分钟给出一份非长详细的报告,暂时只有Pro用户可以用,但用过的都说不错,而且 Open AI 深度研究把 HLE 测试成绩刷到了 26.6%,O1 才 9%。
- 采用优化版o3模型进行网络浏览和数据分析,支持网站内容读取、数据处理、图表生成,通过提示框的"深度研究"开关激活,侧边栏实时显示进度。
- 支持PDF等用户上传文件分析,使用Python工具绘制并迭代图表,响应中可嵌入自生成图表及网页图片,支持精确到句子的文献引用。
- 网页版已向Pro用户开放(月限额100次),本月扩展至移动/桌面端应用,Plus用户约1个月后可用。
这里有一些推特上体验的案例可以看看:
- 医学专家让 Deep Research 协助处理癌症病例,表示生成的报告无可挑剔
- Ethan Mollick 表示 OpenAI 更像是聘请一位固执己见的博士研究人员,跟谷歌的不太一样。
- adi 让 Deep Research 对 Deepseek 的整个研发历史做了专家级的业务分析,而且对未来做了非常详细的推断
- Mckay Wrigley 的用法是让 Deep Research 生成一站式每日新闻报道,只需要提供规则、个人简历、兴趣和首选来源就行
- Patrice 让 Deep Research 规划他离开美国需要处理的税务问题,解决的非常好,比他找的专业顾问要好很多
- Siqi Chen 让 Deep Research 研究帮助她女儿输出颅咽管瘤治疗方案,它提供的价值超过了价值 15 万美元的私人研究团队的价值
Mistral AI 发布 Le Chat 更新和付费服务
把自己当做欧洲 Deepseek 的 Mistral AI 也开始在产品上发力了,发布了一堆功能更新,还有安卓和iOS引用,也公布了付费服务。
- 现在 Le Chat 由他们称作 Flash Answers 的推理引擎提供动力,是世界上最快的Chatbot应用,最高约1000个单词 /秒。
- 现在 Le Chat 支持了常见的联网搜索功能,而且图片和文档理解也支持,可以理解复杂表格。
- 支持代码解释器,该解释器使用户能够执行沙盒代码执行,科学分析,创建可视化和运行模拟。
- 支持图片生成,用的是FLUX,这个比Grok和gpt好
- 还推出了付费服务,一个月14.99美元,可以获得更多的使用次数以及数据不被用于训练,免费的也是足够的。
- 他们说即将推出数据连接器和支持自定义的多步代理。
Github Copilot 发布一系列大更新
Github Copilot 在 Cursor 推出这么久之后他们终于上线了 Agent 模式,还有类似 Devin 的 SWE agents。
- Agent 模式能够迭代自己的代码,识别错误并自动修复,下载 VS Code Insiders,然后启用 agent mode 就行,这个有视觉能力。
- Copilot Edits 正式发布,选择待编辑的内容后再 Chat 框沟通就行,Copilot Edits 采用双模型架构,以提升编辑效率与准确性。首先,基础语言模型会全面考量编辑会话的上下文,生成初步的编辑建议。他们还开发了一个推测解码端点,专为快速应用文件变更而优化。
- SWE agents:一种由 AI 驱动或自动化的系统,旨在辅助(或代表)软件工程师执行工作能够完成多种开发任务,如:代码生成与审查、代码库重构或优化、自动化测试或流水线等流程,并在架构设计错误排查及最佳实践上提供指导。