【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
成色18k1.8.35mb菠萝球队会全力以赴为球迷带来欢乐。希望大家在所有赛事中都能将希望坚守到最后 —— 这支球队将无惧任何对手,与之一战到底。也门胡塞武装15日表示,过去24小时内该组织已向以色列中部地区发射多枚导弹。路透社称,这是本轮冲突中,伊朗盟友“首次加入”。对此,以方知情人士15日表示,以军14日晚对也门实施空袭。而黎巴嫩《每日星报》称,真主党已进入“备战状态”,短期内可能会打击以色列北部的军事设施。成色18k1.8.35mb菠萝低喘 闷哼 律动 舒服吗要么是“半成品”,要么干脆“跳票”,苹果股东们的耐心在这一过程中被耗尽,并不难理解,唯一的问题是,Apple Intelligence的功能延期,与iPhone销量下跌是否存在直接关系?菲利奇在接受采访时表示,阿尔法・罗密欧与玛莎拉蒂将合作开发新车型。品牌合并并不在考虑之列,他指出,两者在 Stellantis 内部的定位并不相同,阿尔法是“高端品牌”,而玛莎拉蒂属于“豪华品牌”。为降低成本,双方仍将在其他层面整合资源,“在可行的地方寻求协同效应”。
20250811 🈲 成色18k1.8.35mb菠萝北京时间6月25日,根据NBA名记Shams的报道,纽约尼克斯正在面试明尼苏达森林狼助理教练迈卡-诺里,前国王队主帅迈克-布朗和前灰熊队主帅泰勒-詹金斯皆为尼克斯主帅的候选人。妈妈装睡配合孩子趴趴Qwen VLo还创新性地引入了一种全新的渐进式生成机制,这一机制不仅提升了生成效率,还适用于需要精细控制的长段落文字生成任务。
📸 王占田记者 张灿华 摄
20250811 😏 成色18k1.8.35mb菠萝早在2023年夏天从朗斯转会至莱比锡之前,米兰就曾与这名前锋有过密切的联系。尤文此前也对奥蓬达表现出了兴趣,前者将其视为奥斯梅恩等锋线优先引援目标的有力替代者。17.c.cow起草据路透社13日报道,伊朗半官方的法尔斯通讯社当天援引安全部门消息人士的话,否认了以色列关于伊朗向以色列发射无人机的报道。该通讯社表示,伊朗的报复“将在不久的将来发生”。
📸 谢其燕记者 孙志强 摄
💦 特斯拉6月22日正式启动无人驾驶出租车项目服务。服务地点为美国得州奥斯汀南部区域,投入10辆新款特斯拉Model Y,服务时间为早6时至午夜12时,价格为固定的4.20美元(约合人民币30元)。国产少女免费观看电视剧字幕