行业动态
Hacker News
重要度: 9
探讨务实企业如何比AI炒作周期更持久,强调实际应用价值
行业动态
Hacker News
重要度: 8
讨论纽约地方法律144对AI行业的影响和担忧
行业动态
Hacker News
重要度: 8
探讨当前AI算法使用中的痛点和挑战
行业动态
Hacker News
重要度: 7
Ask HN: Is the rate of progress in AI exponential?
行业动态
Hacker News
重要度: 7
探讨NLP、AI、ML和机器人技术是短暂趋势还是更深层次变革
行业动态
Hacker News
重要度: 6
AI领域的非主流观点索引,识别不靠谱的AI言论
行业动态
Hacker News
重要度: 6
寻求AI学习推荐书单和学习资源
行业动态
Hacker News
重要度: 6
计算机科学背景初学者询问AI入门经验和预期
行业动态
Hacker News
重要度: 5
谷歌山景城招聘Common Lisp与机器学习实习生
行业动态
Hacker News
重要度: 5
生物信息学职位招聘信息
行业动态
Hacker News
重要度: 4
初创公司通过图书销售筹集资金
行业动态
Hacker News
重要度: 3
介绍AI领域的潜力人物Chris Clark及其"上帝算法"愿景
学术论文
ArXiv
重要度: 9
评估视频模型在零样本推理中的表现,发现其在短程空间一致性有潜力,但长程因果推理和抽象逻辑仍不足。
👨🔬 Ziyu Guo, Xinyan Chen, Renrui Zhang, Ruichuan An, Yu Qi, Dongzhi Jiang, Xiangtai Li, Manyuan Zhang, Hongsheng Li, Pheng-Ann Heng
学术论文
ArXiv
重要度: 8
提出高难度数学推理基准AMO-Bench,显示当前LLM在奥数级别问题上表现不佳,最高准确率仅52.4%。
👨🔬 Shengnan An, Xunliang Cai, Xuezhi Cao, Xiaoyu Li, Yehao Lin, Junlin Liu, Xinxuan Lv, Dan Ma, Xuanlin Wang, Ziwen Wang, Shuang Zhou
学术论文
ArXiv
重要度: 8
引入远程劳动指数衡量AI代理在实际经济任务中的自动化能力,目前最高自动化率仅2.5%。
👨🔬 Mantas Mazeika, Alice Gatti, Cristina Menghini, Udari Madhushani Sehwag, Shivam Singhal, Yury Orlovskiy, Steven Basart, Manasi Sharma, Denis Peskoff, Elaine Lau, Jaehyuk Lim, Lachlan Carroll, Alice Blair, Vinaya Sivakumar, Sumana Basu, Brad Kenstler, Yuntao Ma, Julian Michael, Xiaoke Li, Oliver Ingebretsen, Aditya Mehta, Jean Mottola, John Teichmann, Kevin Yu, Zaina Shaik, Adam Khoja, Richard Ren, Jason Hausenloy, Long Phan, Ye Htet, Ankit Aich, Tahseen Rabbani, Vivswan Shah, Andriy Novykov, Felix Binder, Kirill Chugunov, Luis Ramirez, Matias Geralnik, Hernán Mesura, Dean Lee, Ed-Yeremai Hernandez Cardona, Annette Diamond, Summer Yue, Alexandr Wang, Bing Liu, Ernesto Hernandez, Dan Hendrycks
学术论文
ArXiv
重要度: 8
提出监督博弈框架,使AI代理学习在风险时请示、安全时自主行动,实现部署后安全控制。
👨🔬 William Overman, Mohsen Bayati
学术论文
ArXiv
重要度: 7
发现BF16精度导致RL微调不稳定,改用FP16可消除训练-推理失配,提升稳定性和性能。
👨🔬 Penghui Qi, Zichen Liu, Xiangxin Zhou, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin
学术论文
ArXiv
重要度: 7
提出几何正则化世界模型,通过改进表示学习提升对确定性3D环境的克隆和长程预测能力。
👨🔬 Zaishuo Xia, Yukuan Lu, Xinyi Li, Yifan Xu, Yubei Chen
学术论文
ArXiv
重要度: 7
提出GIFF框架,利用标准价值函数实现多智能体资源分配中的公平性,无需额外训练。
👨🔬 Ashwin Kumar, William Yeoh
学术论文
ArXiv
重要度: 6
发现LLM通过“过滤头”机制执行列表处理任务,其编码的过滤谓词表示具有可移植性和泛化性。
👨🔬 Arnab Sen Sharma, Giordano Rogers, Natalie Shapira, David Bau
学术论文
ArXiv
重要度: 6
提出STaMP量化方法,通过序列维变换和混合精度保持低比特激活量化下的模型精度。
👨🔬 Marco Federici, Riccardo Del Chiaro, Boris van Breugel, Paul Whatmough, Markus Nagel
学术论文
ArXiv
重要度: 6
提出Gistify任务,要求LLM从代码库中提取最小自包含文件复现特定功能,当前模型表现不佳。
👨🔬 Hyunji Lee, Minseon Kim, Chinmay Singh, Matheus Pereira, Atharv Sonwane, Isadora White, Elias Stengel-Eskin, Mohit Bansal, Zhengyan Shi, Alessandro Sordoni, Marc-Alexandre Côté, Xingdi Yuan, Lucas Caccia
学术论文
ArXiv
重要度: 5
提出基于特征和logits的先进采样方法,提升影响函数估计的准确性并减少计算资源消耗。
👨🔬 Jungyeon Koh, Hyeonsu Lyu, Jonggyu Jang, Hyun Jong Yang
学术论文
ArXiv
重要度: 5
研究发现序列模型以几何方式记忆事实,而非简单关联查找,这种几何记忆源于光谱偏差。
👨🔬 Shahriar Noroozizadeh, Vaishnavh Nagarajan, Elan Rosenfeld, Sanjiv Kumar