AIGC Weekly #96 大选影响没啥新闻

其他动态 ✦

Claude 3.5 Haiku 在鸽了 5 天之后发布了。能力提升巨大，但是比 Claude 3 haiku 贵了四倍，输出价格是 Gemini Flash 的 33 倍。属实离谱了，不知道后面会不会推出一个更便宜的型号来补足需求。
Suno V4 要来了，一定要听这个 Demo，太强了。另外他们安卓版本即将上线。
Liblib上线PC客户端，可以一键在本地运行Web UI和Comfyui，而且还可以浏览线上的模型，直接从Liblib下载。
即梦的 S 2.0模型全量上线了，进去就能用。
智谱开源了 CogVideoX1.5 视频生成模型。CogVideoX1.5-5B系列支持更高分辨率的10秒视频。CogVideoX1.5-5B-I2V支持任何分辨率的视频生成。
FLUX1.1 [pro] Ultra 版本更新，支持 10 秒直出 4K 分辨率的图片，Raw Mode 模式，开启后会产生更加真实和自然的图片，我的测试。
Open AI 购买了 chat.com 域名。这个域名上次交易价格已经炒过了 1000万美元，不知道这次 Sam 花了多少钱。
Meshcapade 现在支持用文字生成你要求的3D动作动画，可以结合V2V生成视频实现精细动作控制。
XAI API 开放测试了，每个月 25 美元免费额度.
Open AI 发布了预测输出功能，可以显著降低 gpt-4o 和 gpt-4o-mini 的输出延迟。
可灵上线了单独的iOS客户端，基本支持所有的功能。
微软正在考虑将其人工智能生态系统重命名为“Windows Intelligence”，旨在在其人工智能驱动的工具套件中实现统一的身份。
亚马逊正在就对 Anthropic 进行第二笔数十亿美元的投资进行谈判，条件是它使用亚马逊芯片为其人工智能训练服务器提供动力。
Mistral AI 推出了由 Ministral 8B 模型支持的内容审核 API，可以检测 11 种语言的潜在有害内容。
苹果公司正在通过一项名为“ Project Atlas ”的新内部研究计划，来研究完全基于AI的智能眼镜。
Open AI 安全和协调团队负责人 Lilian Weng 宣布离职，她的博客内容非常牛批，可以多翻翻。
Google 准备推出 Gemini-2.0-Pro-Exp-0111。

图像及视频作品推荐✦

犯罪小说人工智能短片，我最近看到的最好的AI视频，而且图片全是用FLUX生成的。
Julie W 用AI给她的孩子做的睡前故事绘本，非常精致。
AI演绎Donald Trump经典现场，是什么在塑造媒体时代的现场？汗青对于Runway镜头控制的创造性应用。
Huggingface 上现在已经有超过 7000 个 FLUX Lora。前面的 Lora 质量都非常高。
假如复仇者联盟是八九十年代的电影。用八九十年代的影星演出复仇者联盟经典角色，比如尼古拉斯凯奇演洛基

产品推荐 ✦

Krea 训练：低门槛训练FLUX Lora

Krea AI上线了 FLUX Lora的训练功能，这应该是现在门槛最低的FLUX Lora训练工具了，整个UI和交互设计的非常好，清晰、直观、简洁。所以说有些其他类似产品一点也不像互联网产品，照搬开源交互，十几个指标都扔给用户选择，也没有提效设计。
An image to describe post

Unblocked AI：Figma AI图片生成插件

Unblocked AI 这个插件基本上把所有 AI 图像能力都搬进 Figma 了。现在更是支持一键将图标即可变成 3D 形式（也适用于 Logo）主要体验很好，比如这个图标 3D 化的功能还预置了很多提示词。
An image to describe post

Recraft：图形设计生成器

Recraft 发布图形设计生成器，彻底解决海报生成问题。干死 Canva 和 PS。空白画布打字-选择风格-点击生成只需要三步。10 张 Perplexity 宣传图只需要 30 秒，点就完事了。
An image to describe post

Hume 也是发挥他们语音模型的优势基于 Claude 3.5 Haiku 和 EVI 2 语音语言模型重构了他们的应用。在故事讲述方面，EVI 2 展现了其在情感和戏剧性交付上的优势，而与此同时，fal 提供的图像生成能力让这些故事更加生动。对于更深层次的对话和生活建议，EVI 2 与 Claude 3.5 Sonnet 结合，并配合网络搜索功能，以提供更为精准和及时的信息。
An image to describe post

RivalSense：利用AI收集竞争对手信息

RivalSense 是一个利用 AI 技术的企业监控工具，它可以连接超过 80 个数据源，为用户提供深入的企业洞察，帮助他们了解业务伙伴、客户、潜在客户、竞争对手等的最新动态。用户可以通过输入关注的公司和选择相关的监控主题来开始使用。RivalSense AI 会每天监控公司网站、LinkedIn、Twitter、职位发布、新闻网站等，捕捉任何重要变化，并每周提供一个精选、易读的更新邮件。用户可以根据自己的兴趣调整监控的重点，AI 会根据用户的反馈优化信息展示。
An image to describe post

精选内容 ✦

YC Sam Altman 访谈如何创造未来

Sam Altman 对未来技术趋势的展望，特别是人工智能领域的突破和潜力。他强调 AI 技术的快速进步，以及这一进步如何为创业公司提供独特的机遇。

Altman 回顾了 OpenAI 的创立，包括他们如何聚集人才、选择研究方向，以及他们在 AI 领域的一系列成就，如 GPT 系列模型的开发。他还谈到了 OpenAI 与其他大型科技公司的区别和竞争，以及他们如何专注于长期目标，如实现通用人工智能（AGI）。

Altman 对于 AI 技术在未来几年可能达到的里程碑表示乐观，包括解决气候变化、建立太空殖民地、发现宇宙的所有物理定律，以及实现几乎无限的智能和能源。

金融时报系列报道：人工智能的未来

为什么现在夸大人工智能在生产力方面的前景还为时过早；医生如何利用人工智能来改善医疗保健；雇主们正在率先采用人工智能工具来填补技能差距。科技正在改变该行业的各个领域，催生出新的岗位，而更传统的低技能工作则可能面临风险。

接近 400 万曝光的 V0+Cursor AI 编程项目开发技巧

这个老哥在全职工作的同时用 AI 还做了 5 个客户项目。相对体系化，每个人都可以使用。

未来可能重塑全球经济的18个新兴行业领域

麦肯锡的一个报告，详细探讨了未来可能重塑全球经济的18个新兴行业领域。第一还是电商，第二是 AI。

报告预测，未来的竞争大场将包括人工智能软件和服务、云服务、电动汽车、数字广告、半导体、共享自动驾驶汽车、太空、网络安全、电池、模块化建筑、流媒体视频、视频游戏、机器人、工业和消费者生物技术、未来空中交通、抗肥药物和核聚变电力等行业。这些行业的成功与地缘政治发展、人工智能技术的进步以及绿色转型的步伐有关。

写和不写

YC 的创始人认为由于 AI 的加入未来的世界可能会分成会思考的人和不思考的人的世界。

因为计算机科学家 Leslie Lamport 说过：不写作而思考，那只是自以为在思考罢了。

人们现在可以依靠 AI 来完成写作工作，这使得之前必须思考才能写作的压力得以释放。

这将导致一个分层的世界，其中只有少数人会保持写作能力，而大多数人则可能完全失去这一能力。

世界上仍然会有头脑清晰的思考者，但只限于那些主动选择思考的人.

风险、回报与打造独角兽芯片公司，与英伟达一较高下

对 Groq 公司创始人 Jonathan Ross 进行的访谈，探讨了 Groq 如何在半导体行业中与 Nvidia 等巨头竞争。

Ross 分享了 Groq 在设计和生产自己的芯片过程中遇到的挑战，包括技术上的创新、市场定位以及资金筹集等方面。他还谈到了 Groq 如何通过提供定制化的芯片解决方案来满足不同客户的需求，并且强调了公司在可扩展性和性能方面的优势。

No Priors Ep. 89：黄仁勋访谈

与 NVIDIA 首席执行官黄仁勋坐下来，反思该公司过去一年的非凡增长。 Jensen 讨论了 AI 对数据中心的接管以及 NVIDIA 对 x.AI 超级集群的快速发展。对话还涵盖了 Nvidia 长达十年的基础设施押注、软件寿命以及 NVLink 等创新。 Jensen 分享了他对实体人工智能、数字员工的未来以及人工智能如何改变科学发现的看法。

与 OpenAI 首席产品官 Kevin Weil、Anthropic 首席产品官 Mike Krieger 和 SarahGuo 的对话

讨论了 AI 产品开发中的评估和迭代过程，以及如何根据模型的性能调整产品设计。强调了模型能力的不断提升，以及产品经理需要具备的新技能。
分享了如何通过模型进行产品原型设计和用户研究，以及如何通过用户反馈来改进产品。讨论了 AI 在企业中的应用，以及如何处理模型的不确定性和用户的适应问题。
讨论了如何教育产品团队和用户更好地使用 AI 产品，以及如何通过 AI 改善工作效率。分享了一些关于 AI 如何帮助解决实际问题的例子，如自动化 UI 测试和处理客户服务请求。
讨论了 AI 模型的未来发展趋势，包括模型的主动性和异步交互能力。预测了 AI 在未来可能带来的变革，如实时翻译和个性化的 AI 伴侣。
总结了 AI 产品开发中的一些关键点，包括模型的评估、用户教育、产品设计和未来趋势。嘉宾们对 AI 技术的未来表示乐观，并感谢对话的机会。

AI 技术正在改变 YouTube 视频缩略图产业

YouTube 视频缩略图设计成为了一个微观经济体，顶级创作者如 MrBeast 愿意为单个视频的缩略图支付高达 $10,000。然而，AI 工具的出现让一些设计师对未来感到不安。例如，AI 研究人员 Anand Ahuja 推出的 CTRHero 能够在几分钟内创建缩略图，引起了设计师的强烈反对，甚至有人威胁他。

对于 YouTuber 来说，缩略图是吸引观众的关键，顶级创作者会测试多达 20 个不同的缩略图变体。这一趋势孕育了全球的自由职业 YouTube 缩略图艺术家群体。设计师们对于如 Midjourney 和 AlphaCTR 这样的 AI 文本到图像生成工具既感到好奇又感到焦虑。