姜大昕再次 q 到了视频的理解和生成能力统一,在文本上理解和生成已经实现了统一。视频模态的理解和生成统一,不仅可以解决目前 Sora 生成不了太长时间视频的问题,也可以为具身智能提供一个大脑。
阶跃星辰姜大昕认为过去这段时间最重要的三个技术点分别是 GPT-4o、特斯拉 FSD v12、GPT o1,分别是理解世界、模拟世界、归纳世界。
阿里开源 Qwen2.5。
包括语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。所有开放权重的模型都是稠密的、decoder-only的语言模型,提供多种不同规模的版本,包括:
Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B;
Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B; ...展开全文c
包括语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。所有开放权重的模型都是稠密的、decoder-only的语言模型,提供多种不同规模的版本,包括:
Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B;
Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B; ...展开全文c
这段 AI 视频效果不错,教程也比较简单。
首先,使用 Midjourney 风格化制作一组图;然后使用带尾帧的视频生成模型,用一个稍微复杂的提示词去生成视频;最后再串起来、配上音乐、配音。
链接:O网页链接Li陆三金的微博视频
首先,使用 Midjourney 风格化制作一组图;然后使用带尾帧的视频生成模型,用一个稍微复杂的提示词去生成视频;最后再串起来、配上音乐、配音。
链接:O网页链接Li陆三金的微博视频
斯坦福、MIT 的项目 WonderWorld:从单张图像生成交互式三维场景
现有的三维场景生成方法是离线的。也就是说,你提供文本和/或图像,系统在数十分钟或数小时内返回一个固定的 3D 场景。
在游戏开发中,世界设计师希望迭代构建 3D 世界并快速查看中间结果。在 VR/游戏中,用户甚至可能想要一个动态演 ...展开全文c
现有的三维场景生成方法是离线的。也就是说,你提供文本和/或图像,系统在数十分钟或数小时内返回一个固定的 3D 场景。
在游戏开发中,世界设计师希望迭代构建 3D 世界并快速查看中间结果。在 VR/游戏中,用户甚至可能想要一个动态演 ...展开全文c
字节跳动推出 Seed-Music 音乐大模型,核心四大功能:可控音乐生成、谱转曲、词曲编辑、零样本人声克隆。
- Lyrics2Song 可控音乐生成:包含“1 分钟片段生成”、“3 分钟全曲生成”、“歌曲仿写”以及“纯器乐生成”这四种音乐生成任务。
- Lyrics2Leadsheet2Song 谱转曲:lead sheet 即“领谱”, ...展开全文c
- Lyrics2Song 可控音乐生成:包含“1 分钟片段生成”、“3 分钟全曲生成”、“歌曲仿写”以及“纯器乐生成”这四种音乐生成任务。
- Lyrics2Leadsheet2Song 谱转曲:lead sheet 即“领谱”, ...展开全文c
Snap 刚刚推出的 AR 眼镜。
一体机;46 度 fov,每度 37 像素,大约相当于 100 英寸的电视屏幕;配备 2 个 Snapdragon 芯片,电池续航 45 分钟。
一体机;46 度 fov,每度 37 像素,大约相当于 100 英寸的电视屏幕;配备 2 个 Snapdragon 芯片,电池续航 45 分钟。
Elon Musk 转了这条他之前的采访:
「Elon Musk: 要了解人工智能的未来是什么样子,我建议大家读一读伊恩·M·班克斯的《文明》系列丛书。它们对人工智能未来的描述是迄今为止最好的。没有哪本书能与之媲美。
“我建议人们阅读伊恩·M·班克斯的作品。
班克斯的文明书籍可能是最好的设想。...展开全文c
「Elon Musk: 要了解人工智能的未来是什么样子,我建议大家读一读伊恩·M·班克斯的《文明》系列丛书。它们对人工智能未来的描述是迄今为止最好的。没有哪本书能与之媲美。
“我建议人们阅读伊恩·M·班克斯的作品。
班克斯的文明书籍可能是最好的设想。...展开全文c
Scale AI 表示随着 LLMs 能力越来越强大,评估变得越来越困难,该公司已经开始在线征题了,项目名字:Humanity’s Last Exam,人类的最后一场考试。
总奖金 50 万美元,前 50 个问题将获得每份 5000 美元,接下来的 500 个问题将获得每份 500 美元。所有被选中的问题都有资格成为最终论文的共同作者。 ...展开全文c
总奖金 50 万美元,前 50 个问题将获得每份 5000 美元,接下来的 500 个问题将获得每份 500 美元。所有被选中的问题都有资格成为最终论文的共同作者。 ...展开全文c
正在加载中,请稍候...