行业动态
Hacker News
重要度: 9
探讨务实商业模式如何比AI炒作周期更持久,强调行业稳定性。
行业动态
Hacker News
重要度: 8
讨论当前AI算法的实际使用痛点,反映技术落地挑战。
行业动态
Hacker News
重要度: 8
询问对纽约地方法律144号的关注,涉及AI监管与伦理议题。
行业动态
Hacker News
重要度: 7
探讨NLP、AI、ML和机器人技术是短暂趋势还是长期变革。
行业动态
Hacker News
重要度: 7
讨论AI进展速度是否呈指数级增长,涉及技术发展预测。
行业动态
Hacker News
重要度: 6
MIT Non-AI License
行业动态
Hacker News
重要度: 6
Ask HN: What would you read to learn about "artificial intelligence"?
行业动态
Hacker News
重要度: 5
The AI Crackpot Index
行业动态
Hacker News
重要度: 5
Common Lisp + Machine Learning Internship at Google (Mountain View, CA)
行业动态
Hacker News
重要度: 4
Bioinformatician
行业动态
Hacker News
重要度: 3
The Next Bill Gates or Albert Einstein in AI “Chris Clark” – Yourobot
行业动态
Hacker News
重要度: 2
Show HN: Startup Raising capital through Book Sales
学术论文
ArXiv
重要度: 9
研究发现零样本组合动作识别模型因对象驱动动词捷径而失败,提出RCORE框架通过时间基础动词学习和组合感知增强来提升未见组合的准确性。
👨🔬 Geo Ahn, Inwoong Lee, Taeoh Kim, Minho Shim, Dongyoon Wee, Jinwoo Choi
学术论文
ArXiv
重要度: 8
提出PyraTok金字塔分词器,通过多尺度语言对齐量化学习结构化离散潜在表示,显著提升视频重建、文本到视频生成和零样本视频理解性能。
👨🔬 Onkar Susladkar, Tushar Prakash, Adheesh Juvekar, Kiet A. Nguyen, Dong-Hwan Jang, Inderjit S Dhillon, Ismini Lourentzou
学术论文
ArXiv
重要度: 8
提出LLM-in-Sandbox方法,使大语言模型在代码沙箱中探索以激发非代码领域的通用智能,通过强化学习增强智能体能力并实现跨领域泛化。
👨🔬 Daixuan Cheng, Shaohan Huang, Yuxian Gu, Huatong Song, Guoxin Chen, Li Dong, Wayne Xin Zhao, Ji-Rong Wen, Furu Wei
学术论文
ArXiv
重要度: 8
提出Cosmos Policy方法,通过单阶段后训练将预训练视频模型适配为机器人策略,直接生成编码为潜在帧的动作,并在仿真和真实任务中达到最先进性能。
👨🔬 Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, Yen-Chen Lin, Yunhao Ge, Grace Lam, Percy Liang, Shuran Song, Ming-Yu Liu, Chelsea Finn, Jinwei Gu
学术论文
ArXiv
重要度: 7
提出测试时训练发现方法,通过测试时强化学习使大语言模型针对特定问题持续优化,在数学、算法设计和生物学等多个领域达到新的最先进水平。
👨🔬 Mert Yuksekgonul, Daniel Koceja, Xinhao Li, Federico Bianchi, Jed McCaleb, Xiaolong Wang, Jan Kautz, Yejin Choi, James Zou, Carlos Guestrin, Yu Sun
学术论文
ArXiv
重要度: 7
提出反事实训练方法,在训练阶段利用反事实解释使模型学习产生合理且可操作的解释,同时提升对抗鲁棒性。
👨🔬 Patrick Altmeyer, Aleksander Buszydlik, Arie van Deursen, Cynthia C. S. Liem
学术论文
ArXiv
重要度: 6
研究发现简单的结构化提示策略能显著提升神经定理证明器的性能,在miniF2F基准上实现43%的相对改进,表明推理时引导的潜力。
👨🔬 Zachary Burton
学术论文
ArXiv
重要度: 6
提出DistSeal方法,在生成模型的潜在空间中进行水印训练,实现高效且鲁棒的隐写水印,比像素空间方法快达20倍。
👨🔬 Sylvestre-Alvise Rebuffi, Tuan Tran, Valeriu Lacatusu, Pierre Fernandez, Tomáš Souček, Nikola Jovanović, Tom Sander, Hady Elsahar, Alexandre Mourachko
学术论文
ArXiv
重要度: 5
提出全到全训练课程,通过渐进式解掩码增强旋律与和声的交叉注意力,在单编码器和声生成任务中显著提升性能,特别是在域外评估中。
👨🔬 Maximos Kaliakatsos-Papakostas, Dimos Makris, Konstantinos Soiledis, Konstantinos-Theodoros Tsamis, Vassilis Katsouros, Emilios Cambouropoulos
学术论文
ArXiv
重要度: 5
提出系统化提示评估方法,通过锦标赛式框架比较教育应用中不同提示模板的效果,发现结合角色和上下文管理模式的提示表现最佳。
👨🔬 Langdon Holmes, Adam Coscia, Scott Crossley, Joon Suh Choi, Wesley Morris
学术论文
ArXiv
重要度: 4
Motivated reasoning -- the idea that individuals processing information may be motivated to reach a certain conclusion, whether it be accurate or predetermined -- has been well-explored as a human phenomenon. However, it is unclear whether base LLMs mimic these motivational changes. Replicating 4 prior political motivated reasoning studies, we find that base LLM behavior does not align with expected human behavior. Furthermore, base LLM behavior across models shares some similarities, such as smaller standard deviations and inaccurate argument strength assessments. We emphasize the importance of these findings for researchers using LLMs to automate tasks such as survey data collection and argument assessment.
👨🔬 Neeley Pate, Adiba Mahbub Proma, Hangfeng He, James N. Druckman, Daniel Molden, Gourab Ghoshal, Ehsan Hoque
学术论文
ArXiv
重要度: 4
研究在持续分歧条件下数据系统的稳定性约束,建立本体设计的最小结构要求,确保在不兼容扩展中保持稳定参考和可问责性。
👨🔬 Denise M. Case