行业动态
Hacker News
重要度: 9
探讨务实商业模式如何比AI炒作周期更持久,强调商业可持续性。
行业动态
Hacker News
重要度: 8
讨论当前AI算法在实际应用中的痛点与挑战。
行业动态
Hacker News
重要度: 8
询问对纽约地方法律144号(可能涉及AI监管)的担忧。
行业动态
Hacker News
重要度: 7
探讨NLP、AI、ML和机器人技术是短暂趋势还是具有深远影响。
行业动态
Hacker News
重要度: 7
讨论AI领域进展速度是否呈指数级增长。
行业动态
Hacker News
重要度: 6
介绍MIT非AI许可证,涉及开源许可在AI领域的新动向。
行业动态
Hacker News
重要度: 6
征集学习人工智能的推荐阅读材料。
行业动态
Hacker News
重要度: 5
提出AI领域夸大或不实言论的评估指数。
行业动态
Hacker News
重要度: 5
谷歌招聘Common Lisp与机器学习结合的实习生职位。
行业动态
Hacker News
重要度: 5
生物信息学相关职位或讨论,连接AI与生命科学。
行业动态
Hacker News
重要度: 4
展示初创公司通过图书销售筹集资金的创新方式。
行业动态
Hacker News
重要度: 3
宣传Chris Clark为AI领域的下一个比尔·盖茨或爱因斯坦,内容较为夸张。
学术论文
ArXiv
重要度: 10
研究以中文开源审查模型为测试平台,评估多种诱导模型说出被压制知识的技术,发现无聊天模板采样等方法最有效,但无法完全消除错误回答。
👨🔬 Helena Casademunt, Bartosz Cywiński, Khoi Tran, Arya Jakkli, Samuel Marks, Neel Nanda
学术论文
ArXiv
重要度: 9
提出平均偏见有界性框架,为LLM评委系统提供形式化保证,能在保留高排名相关性的同时,严格限制可测量偏见造成的危害。
👨🔬 Benjamin Feuer, Lucas Rosenblatt, Oussama Elachqar
学术论文
ArXiv
重要度: 9
提出RoboPocket系统,利用手机AR可视化策略预测轨迹,让人工操作员能高效识别策略弱点并针对性收集数据,无需物理机器人,实现即时策略迭代。
👨🔬 Junjie Fang, Wendi Chen, Han Xue, Fangyuan Zhou, Tian Le, Yi Wang, Yuting Zhang, Jun Lv, Chuan Wen, Cewu Lu
学术论文
ArXiv
重要度: 8
研究发现推理模型存在“表演性思维链”,其最终答案可早在思维链中途被解码,而回溯等行为与真实不确定性相关。激活探针能高效检测此类表演并实现自适应计算。
👨🔬 Siddharth Boppana, Annabel Ma, Max Loeffler, Raphael Sarfati, Eric Bigelow, Atticus Geiger, Owen Lewis, Jack Merullo
学术论文
ArXiv
重要度: 8
提出无需检索的事实核查任务,引入评估框架并开发INTRA方法,利用模型内部表征交互实现最先进性能,为补充检索式框架提供了新方向。
👨🔬 Artem Vazhentsev, Maria Marina, Daniil Moskovskiy, Sergey Pletenev, Mikhail Seleznyov, Mikhail Salnikov, Elena Tutubalina, Vasily Konovalov, Irina Nikishina, Alexander Panchenko, Viktor Moskvoretskii
学术论文
ArXiv
重要度: 8
提出POET-X,一种可扩展且内存高效的变体,通过正交等价变换优化LLM训练,显著降低计算成本,使十亿参数模型能在单张H100 GPU上预训练。
👨🔬 Zeju Qiu, Lixin Liu, Adrian Weller, Han Shi, Weiyang Liu
学术论文
ArXiv
重要度: 7
系统研究Transformer中的大规模激活和注意力汇聚现象,揭示两者是相关但功能不同的架构产物,并指出预归一化配置是其共现的关键。
👨🔬 Shangwen Sun, Alfredo Canziani, Yann LeCun, Jiachen Zhu
学术论文
ArXiv
重要度: 7
提出首个实时动作条件视频生成系统RealWonder,通过物理模拟将3D动作转化为视觉表征,再输入视频模型,实现13.2 FPS的交互式物理场景探索。
👨🔬 Wei Liu, Ziyu Chen, Zizhang Li, Yue Wang, Hong-Xing Yu, Jiajun Wu
学术论文
ArXiv
重要度: 7
提出CompACT离散分词器,将每个观察压缩至仅8个令牌,大幅降低世界模型规划的计算成本,为实现实时控制迈出实用一步。
👨🔬 Dongwon Kim, Gawon Seo, Jinsung Lee, Minsu Cho, Suha Kwak
学术论文
ArXiv
重要度: 6
推出首个用于生存分析中异质性处理效应估计的综合基准SurvHTE-Bench,包含合成、半合成和真实世界数据集,为公平、可复现的方法评估奠定基础。
👨🔬 Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss, George H. Chen
学术论文
ArXiv
重要度: 6
提出一种混合控制器,将SAC训练的残差策略与名义MPC结合,用于时变微流中细胞推送任务,提高了在非平稳流下的鲁棒性和跟踪精度。
👨🔬 Yanda Yang, Sambeeta Das
学术论文
ArXiv
重要度: 6
引入分布式部分信息谜题任务及多模态数据集,评估LLM和基于动态认知逻辑的管道在构建共同信念方面的能力,发现这对现代LLM构成挑战。
👨🔬 Yifan Zhu, Mariah Bradford, Kenneth Lai, Timothy Obiso, Videep Venkatesha, James Pustejovsky, Nikhil Krishnaswamy