爱可可微博热门分享(5.15)

微博

提示:原网页已由神马搜索转码, 内容由weibo.com提供.

爱可可微博热门分享(5.15)

爱可可-爱生活原创05-15 22:09 投诉

阅读数：7597

No 1. Pytvzhen：能快速将英文YouTube视频转换成中文视频的开源项目，以其高效的翻译流程和高质量的文本转换作为最主要特色
No 2. 免费课程：“构建多模态搜索和RAG系统”，旨在教授如何通过对比学习实现多模态模型训练，构建能处理文本、图像、音频和视频的多模态RAG系统，并用于行业实践
No 3. llama3.np：用纯NumPy实现的Llama 3模型
No 4. The Graph Maker：将任意文本通过给定的本体转换成知识图谱
No 5. 早！
No 6. #免费##抽奖# 携手@异步图书送出 5 本《大模型应用开发动手做AI Agent》
No 7. [IR] MS MARCO Web Search: a Large-scale Information-rich Web ......
No 8. Sakuga-42M Dataset: Scaling Up Cartoon Research：首个包含4200万关键帧的大规模卡通动画数据集，旨在推动卡通动画研究领域的发展
No 9. #免费##抽奖# 携手@博文视点Broadview送出3本《基础统计学（第14版）（双色）》
No 10. 大型语言模型(LLM)推理和服务优化相关论文列表
No 11. Pipecat：一个开源框架，用于构建语音和多模态对话式人工智能Agent，如个人教练、会议助手、儿童故事玩具、客户支持机器人等
No 12. Pi-C.A.R.D：完全运行在树莓派上的 AI 语音助手，具备本地对话、图片识别和隐私保护功能
No 13. 斯坦福大学Hazy Research团队发布了一种新的嵌入式领域特定语言（DSL）ThunderKittens，旨在提高GPU上AI计算的效率，特别是针对NVIDIA H100 GPU
No 14. [CL] A Survey on RAG Meets LLMs: Towards Retrieval-Augmented ......
No 15. [CL] Evaluation of Retrieval-Augmented Generation: A Survey ......
No 16. 致力于研究和整理通用人工智能(AGI)相关论文和资源的开源项目
No 17. Glider：开源的电子墨水屏项目，专注于低延迟和高刷新率，支持多种电子纸显示技术
No 18. PaliGemma：谷歌发布的最新视觉语言模型，结合了图像编码器SigLIP和文本解码器Gemma-2B，支持多种视觉语言任务
No 19. pixi：用 Zig 语言编写的跨平台开源像素艺术编辑器和动画编辑器
No 20. [CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》
No 21. Google推出 Gemini 1.5 Pro 的质量改进和新的 1.5 Flash 模型，增加了两个新的 Gemma 模型，并为 Gemini API 引入了新特性和定价选项
No 22. [LG]《RLHF Workflow: From Reward Modeling to Online RLHF》
No 23. 新书《大语言模型实战》，旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统
No 24. [CV]《MambaOut: Do We Really Need Mamba for Vision?》
No 25. LinearBoost Classifier：建立在快速线性分类器基础上的高效准确的分类算法
No 26. Podman AI Lab：一个开源扩展，允许用户在本地环境中使用容器与大型语言模型(LLM)进行交互，支持AI模型下载、推理服务器启动、本地实验场以及AI应用开发
No 27. MeeseeksAI：用Mermaid图来编排人工智Agent的框架
No 28. '《动手学大模型》
No 29. 高质量的合成文本数据集资源列表
No 30. Needle in a Needlestack：用于评估大型语言模型(LLM)注意力能力的更高级的基准测试工具
No 31. AI Agent正在颠覆自动化领域
No 32. 几篇论文实现代码
No 33. [CL] AgentClinic: a multimodal agent benchmark to evaluate ......
No 34. data-to-paper：利用AI进行端到端科研的框架，从原始数据开始，一直到生成全面、透明、可验证的科研论文
No 35. Kolmogorov-Arnold Network (KAN)通俗解析
No 36. Beta9：超快无服务器 GPU 运行时
No 37. 晚安～
No 38. PyxLSTM：实现了xLSTM架构的Python库，通过引入指数门控、记忆混合和矩阵记忆结构，提升了序列建模任务的性能和可扩展性
No 39. [LG]《Deep MMD Gradient Flow without adversarial training》
No 40. ntscQT：用于模拟 VHS(录像带)视频效果的 Python GUI 工具，适用于艺术创作和模拟视频信号中的模拟伪影
No 41. 'MaxKey SSO ,Leading-Edge IAM-IDaas(Identity and Access Management) ......
No 42. 'Convolutional Kolmogorov-Arnold Network (CKAN) - This project ......
No 43. 通过可微Marching Cubes提取网格，并将高斯分布严格绑定到其面上，实现了混合式场景表示的直接端到端学习，使场景几何重建与基于高斯的实时渲染达成统一。//[CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》
No 44. 通过分析Mamba架构与不同视觉任务的适配性，提出并验证了SSM对图像分类可能是不必要的而对检测和分割可能还有帮助的假说，为未来视觉Mamba模型的设计提供了重要指导。//[CV]《MambaOut: Do We Really Need Mamba for Vision?》
No 45. [LG]《Memory Mosaics》
No 46. Model Explorer：现代化的模型图可视化和调试工具
No 47. Barkour Robot：Google DeepMind开发的敏捷四足机器人，旨在支持各种研究项目，包含设计资产（CAD、PCBA设计、装配指南）和核心软件（固件和低级代码）
No 48. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》
No 49. 今日推介(第1406期)：视觉任务有必要用Mamba吗、柏拉图(统一)表示假说、无需对抗性训练的深度MMD梯度流、RLHF工作流、通过3D高斯Splatting直接学习网格和外观 ......
No 50. MuLan：旨在通过Adapter技术，使多语言扩散模型支持超过110种语言，而无需额外训练

发布于北京

爱可可-爱生活

北邮PRIS模式识别实验室陈老师商务合作 QQ:1289468869 Email:1289468869@qq.com

推荐阅读

换一换查看更多