行业动态
Hacker News
重要度: 9
提供比AWS便宜50%的云计算GPU,为开发者节省成本。
行业动态
Hacker News
重要度: 8
探讨AI进步速度是否呈指数级增长。
行业动态
Hacker News
重要度: 7
探讨当前AI算法使用中的痛点。
行业动态
Hacker News
重要度: 7
讨论NLP、AI、ML和机器人技术是短暂趋势还是更深远的变革。
行业动态
Hacker News
重要度: 6
谷歌提供Common Lisp与机器学习实习机会。
行业动态
Hacker News
重要度: 6
初学者探讨涉足AI领域的预期。
行业动态
Hacker News
重要度: 5
AI Crackpot指数探讨AI领域的非主流观点。
行业动态
Hacker News
重要度: 5
探讨AI领域的下一个比尔·盖茨或爱因斯坦。
行业动态
Hacker News
重要度: 5
探讨攻读CS博士学位的想法。
行业动态
Hacker News
重要度: 4
讨论对纽约市地方法律144号的关注。
行业动态
Hacker News
重要度: 4
生物信息学家的职业讨论。
行业动态
Hacker News
重要度: 3
初创公司通过书籍销售筹集资金。
开源项目
GitHub
重要度: 9
一站式开源AI框架,支持语义搜索和语言模型工作流。
⭐ 11199 stars
开源项目
GitHub
重要度: 8
每周更新的机器学习Python库排名列表。
⭐ 21543 stars
开源项目
GitHub
重要度: 7
简化自定义机器学习模型开发的工具。
⭐ 11198 stars
开源项目
GitHub
重要度: 7
PyTorch实现的稳定基线,可靠的强化学习算法。
⭐ 11083 stars
开源项目
GitHub
重要度: 6
风格迁移和深度学习的特征转换工具。
⭐ 11184 stars
开源项目
GitHub
重要度: 6
帮助学习深度强化教育的教育资源。
⭐ 11038 stars
开源项目
GitHub
重要度: 5
来自FAANG等公司的机器学习面试资料。
⭐ 11122 stars
开源项目
GitHub
重要度: 5
计算机视觉深度学习资源精选列表。
⭐ 11000 stars
开源项目
GitHub
重要度: 5
TensorFlow实现的快速风格迁移CNN。
⭐ 10965 stars
开源项目
GitHub
重要度: 4
在浏览器中训练卷积神经网络的JavaScript库。
⭐ 10993 stars
开源项目
GitHub
重要度: 4
机器学习算法实现的简洁示例。
⭐ 10862 stars
开源项目
GitHub
重要度: 3
通过解谜学习CUDA。
⭐ 11260 stars
学术论文
ArXiv
重要度: 9
提出TreeBench评估基准和TreeVGR训练范式,提升视觉基础推理能力。
👨🔬 Haochen Wang, Xiangtai Li, Zilong Huang, Anran Wang, Jiacong Wang, Tao Zhang, Jiani Zheng, Sule Bai, Zijian Kang, Jiashi Feng, Zhuochen Wang, Zhaoxiang Zhang
学术论文
ArXiv
重要度: 9
提出MIRIX多代理记忆系统,提升LLM代理的记忆和推理能力。
👨🔬 Yu Wang, Xi Chen
学术论文
ArXiv
重要度: 8
介绍PyVision框架,使MLLMs能自主生成和执行Python工具,提升视觉推理。
👨🔬 Shitian Zhao, Haoquan Zhang, Shaoheng Lin, Ming Li, Qilong Wu, Kaipeng Zhang, Chen Wei
学术论文
ArXiv
重要度: 8
Video large language models (LLMs) achieve strong video understanding by
leveraging a large number of spatio-temporal tokens, but suffer from quadratic
computational scaling with token count. To address this, we propose a
training-free spatio-temporal token merging method, named STTM. Our key insight
is to exploit local spatial and temporal redundancy in video data which has
been overlooked in prior work. STTM first transforms each frame into
multi-granular spatial tokens using a coarse-to-fine search over a quadtree
structure, then performs directed pairwise merging across the temporal
dimension. This decomposed merging approach outperforms existing token
reduction methods across six video QA benchmarks. Notably, STTM achieves a
2$\times$ speed-up with only a 0.5% accuracy drop under a 50% token budget, and
a 3$\times$ speed-up with just a 2% drop under a 30% budget. Moreover, STTM is
query-agnostic, allowing KV cache reuse across different questions for the same
video. The project page is available at https://www.jshyun.me/projects/sttm.
👨🔬 Jeongseok Hyun, Sukjun Hwang, Su Ho Han, Taeoh Kim, Inwoong Lee, Dongyoon Wee, Joon-Young Lee, Seon Joo Kim, Minho Shim
学术论文
ArXiv
重要度: 8
提出EXPO算法,通过表达性策略优化提升强化学习的样本效率。
👨🔬 Perry Dong, Qiyang Li, Dorsa Sadigh, Chelsea Finn
学术论文
ArXiv
重要度: 8
介绍LongVILA框架,扩展视觉语言模型至长视频推理,提升效率。
👨🔬 Yukang Chen, Wei Huang, Baifeng Shi, Qinghao Hu, Hanrong Ye, Ligeng Zhu, Zhijian Liu, Pavlo Molchanov, Jan Kautz, Xiaojuan Qi, Sifei Liu, Hongxu Yin, Yao Lu, Song Han
学术论文
ArXiv
重要度: 7
提出KARL单通自适应标记器,预测图像适当标记数,提升效率。
👨🔬 Shivam Duggal, Sanghyun Byun, William T. Freeman, Antonio Torralba, Phillip Isola
学术论文
ArXiv
重要度: 7
引入BASIC框架,多粒度评估脑视觉解码方法的结构保真度和语义对齐。
👨🔬 Weihao Xia, Cengiz Oztireli
学术论文
ArXiv
重要度: 7
提出Geometry Forcing方法,增强视频扩散模型的3D一致性。
👨🔬 Haoyu Wu, Diankun Wu, Tianyu He, Junliang Guo, Yang Ye, Yueqi Duan, Jiang Bian
学术论文
ArXiv
重要度: 7
提出Q-chunking方法,通过动作分块提升长视野稀疏奖励任务的强化学习效率。
👨🔬 Qiyang Li, Zhiyuan Zhou, Sergey Levine
学术论文
ArXiv
重要度: 6
评估显示,结合RAG的SLMs在风湿病临床决策支持中表现优于LLMs。
👨🔬 Sabine Felde, Rüdiger Buchkremer, Gamal Chehab, Christian Thielscher, Jörg HW Distler, Matthias Schneider, Jutta G. Richter
学术论文
ArXiv
重要度: 6
研究语言模型作为隐式奖励模型的泛化差距原因。
👨🔬 Noam Razin, Yong Lin, Jiarui Yao, Sanjeev Arora