行业动态
Hacker News
重要度: 8
MIT发布非AI许可证,限制AI使用。
行业动态
Hacker News
重要度: 7
讨论纽约市AI招聘法规的影响。
行业动态
Hacker News
重要度: 7
探讨AI进展速度是否呈指数级。
行业动态
Hacker News
重要度: 6
讨论传统业务如何比AI热潮更持久。
行业动态
Hacker News
重要度: 6
询问当前AI算法使用中的痛点。
行业动态
Hacker News
重要度: 5
提出AI领域伪科学指数。
行业动态
Hacker News
重要度: 5
推荐学习AI的阅读材料。
行业动态
Hacker News
重要度: 4
创业公司通过售书筹资。
行业动态
Hacker News
重要度: 3
声称AI将产生超级智能。
行业动态
Hacker News
重要度: 3
谷歌提供Common Lisp机器学习实习。
行业动态
Hacker News
重要度: 2
生物信息学相关讨论。
行业动态
Hacker News
重要度: 2
讨论NLP、AI、ML、机器人是否只是短暂趋势。
学术论文
ArXiv
重要度: 8
利用从学生代码中提取的模式化知识组件,指导生成个性化示例,提高教学针对性。
👨🔬 Griffin Pitts, Muntasir Hoq, Peter Brusilovsky, Narges Norouzi, Arto Hellas, Juho Leinonen, Bita Akram
学术论文
ArXiv
重要度: 8
提出临床AI评估的案例特定评分标准,LLM生成的评分标准与临床医生一致性高且成本低。
👨🔬 Aaryan Shah, Andrew Hines, Alexia Downs, Denis Bajet, Paulius Mui, Fabiano Araujo, Laura Offutt, Aida Rutledge, Elizabeth Jimenez
学术论文
ArXiv
重要度: 8
通过Minecraft基准测试评估AI代理的发现-应用能力,发现瓶颈在于问题识别。
👨🔬 Zhou Ziheng, Huacong Tang, Jinyuan Zhang, Haowei Lin, Bangcheng Yang, Qian Long, Fang Sun, Yizhou Sun, Yitao Liang, Ying Nian Wu, Demetri Terzopoulos, Xiaofeng Gao
学术论文
ArXiv
重要度: 7
研究从多个思维链中学习,发现被动收集数据困难,提出主动学习算法。
👨🔬 Nirmit Joshi, Roey Magen, Nathan Srebro, Nikolaos Tsilivis, Gal Vardi
学术论文
ArXiv
重要度: 7
提出SIREN-RoPE,将旋转空间变为可学习,提升注意力机制表现力。
👨🔬 Hailing Cheng, Daqi Sun, Xinyu Lu
学术论文
ArXiv
重要度: 7
开发SpecValidator检测代码生成任务描述缺陷,性能优于大型模型。
👨🔬 Amal Akli, Mike Papadakis, Maxime Cordy, Yves Le Traon
学术论文
ArXiv
重要度: 7
提出用户中心的可信AI方法,通过基准测试和扰动分析指导安全部署。
👨🔬 Aaron J. Li, Nicolas Sanchez, Hao Huang, Ruijiang Dong, Jaskaran Bains, Katrin Jaradeh, Zhen Xiang, Bo Li, Feng Liu, Aaron Kornblith, Bin Yu
学术论文
ArXiv
重要度: 7
提出Agent Viability框架和RiskGate,实现自主代理的自适应运行时治理。
👨🔬 German Marin, Jatin Chaudhary
学术论文
ArXiv
重要度: 6
提出HDET,利用多副本探索学习率,自动调整超参数,提升训练效果。
👨🔬 Hailing Cheng, Tao Huang, Chen Zhu, Antonio Alonso
学术论文
ArXiv
重要度: 6
在宝马案例中,使用LLM生成多文件DSL代码,微调显著提升准确性和结构保真度。
👨🔬 Sivajeet Chand, Kevin Nguyen, Peter Kuntz, Alexander Pretschner
学术论文
ArXiv
重要度: 6
评估金融应用中LLM的谄媚行为,发现性能下降不大,但偏好信息导致失败。
👨🔬 Zhenyu Zhao, Aparna Balagopalan, Adi Agrawal, Dilshoda Yergasheva, Waseem Alshikh, Daniel M. Bikel
学术论文
ArXiv
重要度: 5
研究土耳其语中源可信度对证据形态的影响,人类敏感而LLM不稳定。
👨🔬 Sercan Karakaş, Yusuf Şimşek