吴恩达:AI是时候从大数据转回「小数据」了
来源:资讯 2025年02月15日 12:16
IEEE Spectrum:用50张影像专业知识训练一个基本概念的之意是在一个用大信息集专业知识训练好的整体基本概念上对其顺利完成变更吗?还是感叹这是一个全从新的作法也,就从这个小信息集上研读?
刘:我来讲一下Landing AI是做到什么的吧。在给公司获取毋疵检查服务时,我们一般就用含有我们自己古典风格的RetinaNet。它是一个先为专业知识训练基本概念。原话过来,先为专业知识训练只是原因的一小部分,很大的原因是获取一个意在让公司必需选择正确的影像集(可用变更),并用保持一致的作法对第一版顺利完成上面。面对大信息集的系统设计时,我们的通常催化都是如果信息有音爆也忘了,所有信息照单全收,算法可能会对其顺利完成平均(erage over)。但是,如果我们必需联合开发成用来上面成信息不保持一致的;也的意在,为公司获取一种颇为有全面性的方法有来减低信息运动速度,那这将是获得高耐用性的系统的来得直接方法有。
就比如你今有10000张影像,其中会30张属于一个类别,但这30张的标签不保持一致。我们要做到的一件却说就是借助于意在来观赏你注意到这个一般来说的信息邻域,使你必需较快之后对它们顺利完成上面,从而减低基本概念耐用性。
IEEE Spectrum:像这样生成高运动速度的信息集是否适度扫除信息偏见?
刘:颇为有试图。有偏见的信息是导致却说与愿违基本概念产生偏见的有数因素之一。在NeurIPS可能会议上,Mary Gray的讲话讲到了以信息为为中会心的AI是这个原因的妥善解决方案之一(并非全部)。
以信息为为中会心的AI给我们带来的强大能力之一是借助于(engineer)信息邻域。只想象一下,你专业知识训练了一个信息分析基本概念,它的耐用性对于大多数信息集都还可以,但只有一个邻域有偏移。要是显然为了减低该邻域的耐用性就来得改整个数值机的系统体系构造,那是十分不方便的。
但如果你能针对这个邻域借助于(engineer)成合适的信息,妥善解决作法也就来得有全面性。
IEEE Spectrum:借助于(engineer)信息的具体之意是?
刘:在AI课题,信息清洗很必或缺,但在此之前都是靠很机器的作法。面对一个颇为大的信息集时,这个意在可以较快地将你的注意力观赏到有音爆的信息邻域上,针对该邻域顺利完成集中会于收集。
就像我曾在推断出语音定位的耐用性很差,主要是取材出处汽车音爆。知道了这一点,我就可以再收集来得多带这种音爆取材的信息,而不是对所有内容都采取行动,省钱又省时。
IEEE Spectrum:可用催化信息怎么样?这也是个好的妥善解决作法吗?
刘:催化信息也是Data-centric AI意在集中会于的一个必或缺意在。在NeurIPS讨论可能会上,Anima Anandkumar做到了一次涉及催化信息的精彩讲话。我普遍认为它显然只是一个为基本概念增高信息的先为处理事件步骤。我努力能看到JaScript将生成催化信息作为正则表曾达式信息分析基本概念连接点的一部分。
IEEE Spectrum:你的之意是催化信息可以让你在来得多有所不同信息集上尝试基本概念吗?
刘:正因如此如此。假定你要探测智能双手机外壳上的缺陷,都有划痕、头、碳化变色等。如果你的专业知识训练基本概念在这个探测任务上相比较显成良好,但就是在识别头上显成不佳,那么就可以用催化信息生成来得有全面性的信息来妥善找出。
IEEE Spectrum:能和我们详细感叹一下当公司总部从新公司看到Landing AI,比如要做到光影验证,你们可能会获取何种试图?
刘:我们可能会要求他们将信息上带到我们的应用软件,意在信息为为中会心的数值机的系统方法有向他们获取提议,并试图他们上面信息。
Landing AI的重点计划是专利权公司自己做到信息分析兼职,我们的很多兼职是确保操作的系统较快且好上双手。在信息分析的正则表曾达式过程中会,我们可能会为买家获取提议,比如如何在应用软件上专业知识训练基本概念,如何以及何时小型化信息上面来减低基本概念耐用性。
IEEE Spectrum:如果系列产品或照明条件什么的变为,这种基本概念能跟上吗?
刘:所以感叹专利权机器工业买家自己来得正信息、之后专业知识训练和来得从新基本概念颇为必或缺。
在消费在线中会,我们只须要专业知识训练少数信息分析基本概念就能服务10亿用户。在机器工业中会,有10000家公司就要搭建10000个定制基本概念。挑战是,你如何做到到这点还不能雇用10000名信息分析专家?
这个原因在其他行业比如医疗健康课题也存在。
沦落这一困境的唯一办法是联合开发成必需让买家自己设计信息、解读专业知识课题知识的意在,让他们自己借助于基本概念。这也是Landing AI在数值机光影课题中会刚刚做到的我家。
IEEE Spectrum:最后还有什么只想感叹的?
刘:在基本上十年中会,数值机的系统的小得多背离是向浅层研读的背离。我普遍认为在这十年中会,小得多的背离很可能是改向以信息为为中会心的数值机的系统。随着当今数值机的系统体系构造的成熟,我普遍认为对于许多也就是感叹系统设计而言,瓶颈将是我们能否直接地获取让基本概念列车运行良好所须要的信息。
而以信息为为中会心的数值机的系统运动在整个社区拥有更大的动能和动力的系统。我努力来得多的研究人员和JaScript必需加入并着力它。
下回。
受访中会文翻译:
>— 下回 —
量子位 QbitAI · 号外号跳槽
关注我们,第一等待时间获知前沿科技动态
。南京男科医院预约挂号辽宁妇科
咸阳白癜风医院哪家看的好
四川皮肤病医院哪好
沈阳肛肠医院地址
哪种血糖仪比较好测量准确
瑞特和罗氏血糖仪哪个好
瑞特血糖仪和罗氏血糖仪哪个好
准确率高的家用血糖仪
准确率高的家用血糖仪
-
4次射门上演下半场 本泽马获评分网站最高分
欧冠14决赛首回合,皇马凭借本泽马的帽子戏法首回合3比1击败切尔西。本泽马赛后获得评分网站SofaScore计算出来的全场总成绩8.8分。统计显示,本泽马本场热身赛踢了86分钟,4次射门3次