微博

电脑版
提示:原网页已由神马搜索转码, 内容由weibo.com提供.

i陆三金

i陆三金

互联网科技博主
置顶最近在关注的两个方向,一个是AI+游戏,一个是AI机器人。

先说第一点,我是多年的游戏玩家,游戏爱好者,一直想在游戏领域搞点动静,但一直未遂,ChatGPT浪潮来了之后,一直在悄悄观察游戏行业的动静,但目前大家主要还是围绕美术资产、NPC对话、代码copilot等生产力提升方向。

我希望能看到改变格局 ​​​​...展开全文c
Elon Musk 去年的一个采访,如果答案是宇宙,那么问题是什么 ? Li陆三金的微博视频​​​​
//@不是郑小康:xAI 联创 Greg Yang:同一个模型应该具备所有这些能力。 ¡查看图片//@不是郑小康:中间这个好懂,GPT-4o 是理解世界,GPT o1 是归纳世界…[疑问]
阶跃星辰姜大昕认为过去这段时间最重要的三个技术点分别是 GPT-4o、特斯拉 FSD v12、GPT o1,分别是理解世界、模拟世界、归纳世界。 ​​​​
又降价了。 ​​​​
银河通用王鹤:人形机器人上半身很重要。

逐际动力张巍:人形机器人还是看腿。 ​​​​
姜大昕再次 q 到了视频的理解和生成能力统一,在文本上理解和生成已经实现了统一。视频模态的理解和生成统一,不仅可以解决目前 Sora 生成不了太长时间视频的问题,也可以为具身智能提供一个大脑。 ​​​​
阶跃星辰姜大昕认为过去这段时间最重要的三个技术点分别是 GPT-4o、特斯拉 FSD v12、GPT o1,分别是理解世界、模拟世界、归纳世界。 ​​​​
阿里开源 Qwen2.5。

包括语言模型 Qwen2.5,以及专门针对编程的 Qwen2.5-Coder 和数学的 Qwen2.5-Math 模型。所有开放权重的模型都是稠密的、decoder-only的语言模型,提供多种不同规模的版本,包括:

Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B;
Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B; ​​​​...展开全文c
这段 AI 视频效果不错,教程也比较简单。

首先,使用 Midjourney 风格化制作一组图;然后使用带尾帧的视频生成模型,用一个稍微复杂的提示词去生成视频;最后再串起来、配上音乐、配音。

链接:O网页链接Li陆三金的微博视频​​​​
斯坦福、MIT 的项目 WonderWorld:从单张图像生成交互式三维场景

现有的三维场景生成方法是离线的。也就是说,你提供文本和/或图像,系统在数十分钟或数小时内返回一个固定的 3D 场景。

在游戏开发中,世界设计师希望迭代构建 3D 世界并快速查看中间结果。在 VR/游戏中,用户甚至可能想要一个动态演 ​​​​...展开全文c
字节跳动推出 Seed-Music 音乐大模型,核心四大功能:可控音乐生成、谱转曲、词曲编辑、零样本人声克隆。

- Lyrics2Song 可控音乐生成:包含“1 分钟片段生成”、“3 分钟全曲生成”、“歌曲仿写”以及“纯器乐生成”这四种音乐生成任务。

- Lyrics2Leadsheet2Song 谱转曲:lead sheet 即“领谱”, ​​​​...展开全文c
Snap 发了 AR 眼镜,在广告中非常卖力的嘲讽 Meta 的 Quest。 Li陆三金的微博视频​​​​
OpenAI o1 领导团队的 Mark Chen 如是表示。 ​​​​
Snap 刚刚推出的 AR 眼镜。

一体机;46 度 fov,每度 37 像素,大约相当于 100 英寸的电视屏幕;配备 2 个 Snapdragon 芯片,电池续航 45 分钟。 ​​​​
Elon Musk 转了这条他之前的采访:

「Elon Musk: 要了解人工智能的未来是什么样子,我建议大家读一读伊恩·M·班克斯的《文明》系列丛书。它们对人工智能未来的描述是迄今为止最好的。没有哪本书能与之媲美。

“我建议人们阅读伊恩·M·班克斯的作品。

班克斯的文明书籍可能是最好的设想。...展开全文c
Scale AI 表示随着 LLMs 能力越来越强大,评估变得越来越困难,该公司已经开始在线征题了,项目名字:Humanity’s Last Exam,人类的最后一场考试。

总奖金 50 万美元,前 50 个问题将获得每份 5000 美元,接下来的 500 个问题将获得每份 500 美元。所有被选中的问题都有资格成为最终论文的共同作者。 ​​​​...展开全文c

正在加载中,请稍候...