微博

电脑版
提示:原网页已由神马搜索转码, 内容由weibo.com提供.
爱可可微博热门分享(5.15)
阅读数:7597

​​No 1. Pytvzhen:能快速将英文YouTube视频转换成中文视频的开源项目,以其高效的翻译流程和高质量的文本转换作为最主要特色
No 2. 免费课程:“构建多模态搜索和RAG系统”,旨在教授如何通过对比学习实现多模态模型训练,构建能处理文本、图像、音频和视频的多模态RAG系统,并用于行业实践
No 3. llama3.np:用纯NumPy实现的Llama 3模型
No 4. The Graph Maker:将任意文本通过给定的本体转换成知识图谱
No 5. 早!太阳
No 6. #免费##抽奖# 携手@异步图书送出 5 本《大模型应用开发 动手做AI Agent》
No 7. [IR] MS MARCO Web Search: a Large-scale Information-rich Web ......
No 8. Sakuga-42M Dataset: Scaling Up Cartoon Research:首个包含4200万关键帧的大规模卡通动画数据集,旨在推动卡通动画研究领域的发展
No 9. #免费##抽奖# 携手@博文视点Broadview送出3本《基础统计学(第14版)(双色)》
No 10. 大型语言模型(LLM)推理和服务优化相关论文列表
No 11. Pipecat:一个开源框架,用于构建语音和多模态对话式人工智能Agent,如个人教练、会议助手、儿童故事玩具、客户支持机器人等
No 12. Pi-C.A.R.D:完全运行在树莓派上的 AI 语音助手,具备本地对话、图片识别和隐私保护功能
No 13. 斯坦福大学Hazy Research团队发布了一种新的嵌入式领域特定语言(DSL)ThunderKittens,旨在提高GPU上AI计算的效率,特别是针对NVIDIA H100 GPU
No 14. [CL] A Survey on RAG Meets LLMs: Towards Retrieval-Augmented ......
No 15. [CL] Evaluation of Retrieval-Augmented Generation: A Survey ......
No 16. 致力于研究和整理通用人工智能(AGI)相关论文和资源的开源项目
No 17. Glider:开源的电子墨水屏项目,专注于低延迟和高刷新率,支持多种电子纸显示技术
No 18. PaliGemma:谷歌发布的最新视觉语言模型,结合了图像编码器SigLIP和文本解码器Gemma-2B,支持多种视觉语言任务
No 19. pixi:用 Zig 语言编写的跨平台开源像素艺术编辑器和动画编辑器
No 20. [CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》
No 21. Google推出 Gemini 1.5 Pro 的质量改进和新的 1.5 Flash 模型,增加了两个新的 Gemma 模型,并为 Gemini API 引入了新特性和定价选项
No 22. [LG]《RLHF Workflow: From Reward Modeling to Online RLHF》
No 23. 新书《大语言模型实战》,旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统
No 24. [CV]《MambaOut: Do We Really Need Mamba for Vision?》
No 25. LinearBoost Classifier:建立在快速线性分类器基础上的高效准确的分类算法
No 26. Podman AI Lab:一个开源扩展,允许用户在本地环境中使用容器与大型语言模型(LLM)进行交互,支持AI模型下载、推理服务器启动、本地实验场以及AI应用开发
No 27. MeeseeksAI:用Mermaid图来编排人工智Agent的框架
No 28. '《动手学大模型》
No 29. 高质量的合成文本数据集资源列表
No 30. Needle in a Needlestack:用于评估大型语言模型(LLM)注意力能力的更高级的基准测试工具
No 31. AI Agent正在颠覆自动化领域
No 32. 几篇论文实现代码
No 33. [CL] AgentClinic: a multimodal agent benchmark to evaluate ......
No 34. data-to-paper:利用AI进行端到端科研的框架,从原始数据开始,一直到生成全面、透明、可验证的科研论文
No 35. Kolmogorov-Arnold Network (KAN)通俗解析
No 36. Beta9:超快无服务器 GPU 运行时
No 37. 晚安~ 月亮
No 38. PyxLSTM:实现了xLSTM架构的Python库,通过引入指数门控、记忆混合和矩阵记忆结构,提升了序列建模任务的性能和可扩展性
No 39. [LG]《Deep MMD Gradient Flow without adversarial training》
No 40. ntscQT:用于模拟 VHS(录像带)视频效果的 Python GUI 工具,适用于艺术创作和模拟视频信号中的模拟伪影
No 41. 'MaxKey SSO ,Leading-Edge IAM-IDaas(Identity and Access Management) ......
No 42. 'Convolutional Kolmogorov-Arnold Network (CKAN) - This project ......
No 43. 通过可微Marching Cubes提取网格,并将高斯分布严格绑定到其面上,实现了混合式场景表示的直接端到端学习,使场景几何重建与基于高斯的实时渲染达成统一。//[CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》
No 44. 通过分析Mamba架构与不同视觉任务的适配性,提出并验证了SSM对图像分类可能是不必要的而对检测和分割可能还有帮助的假说,为未来视觉Mamba模型的设计提供了重要指导。//[CV]《MambaOut: Do We Really Need Mamba for Vision?》
No 45. [LG]《Memory Mosaics》
No 46. Model Explorer:现代化的模型图可视化和调试工具
No 47. Barkour Robot:Google DeepMind开发的敏捷四足机器人,旨在支持各种研究项目,包含设计资产(CAD、PCBA设计、装配指南)和核心软件(固件和低级代码)
No 48. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》
No 49. 今日推介(第1406期):视觉任务有必要用Mamba吗、柏拉图(统一)表示假说、无需对抗性训练的深度MMD梯度流、RLHF工作流、通过3D高斯Splatting直接学习网格和外观 ......
No 50. MuLan:旨在通过Adapter技术,使多语言扩散模型支持超过110种语言,而无需额外训练​​​​

发布于 北京
推荐阅读