A Chat with Andrew on MLOps: From Model-centric to Data-centric AI 学习记录

博主：淡叔
发布时间：2021 年 03 月 28 日
9372次浏览
18 条评论
1111字数
分类：学习记录 NLP

本学习记录来自团队李晖同学，感谢她的分享。

视频介绍

视频地址 https://www.youtube.com/watch?v=06-AZXmwHjo
视频内容主要是吴恩达老师他们对于人工智能从模型->数据转变的一些研究和分享，对于相关领域的同学，都有值得借鉴的地方。

关键PPT

数据智能-1.png
数据智能-2.png
数据智能-3.png
数据智能-4.png
数据智能-5.png
数据智能-6.png

总结重点

现在更多的做法是以模型为中心，而不是以数据为中心。为什么要以数据为中心？

如果数据质量比较好，可以在很多个模型上都表现优秀。
小数据情况下，提升数据质量或者增大数据数量带来的提升效果，远远大于改变模型。
可以固定模型，优化数据。

如何构建一个以数据为中心的体系？作者表示他们也在探索中，但是要在整个过程中，注意数据的一致性，以及高质量。并给出了在每个阶段应该注意什么，以及什么是高质量的数据。

一些有意思的点

清洗脏数据与扩大一倍数据集带来的提升效果相当。
kaggle上大部分的训练数据都在1万条以下（小数据），也符合很多小公司的实际情况。在1万条以下的数据集上，把控数据质量带来的提升效果将是明显的。
3.在大数据上，脏数据带来的影响远小于小数据集。

对于我们来说，其实也在按照这个流程走，只是不成系统。特别是在数据的一致性上，在多人标注，标注规范不清晰的时候很可能造成数据不一致。还有就是线上的反馈流程不完善，不能很好的挑选出有偏差的数据。这些都是后续需要注意的点。

最后修改：2021 年 03 月 28 日 09 : 11 PM

18 条评论

思维峰网络
March 29th, 2025 at 07:52 am

我们汇聚了一批互联网技术和营销领域的专业人才，专注于为企业提供从需求分析到系统实施的全流程信息化建设服务。公司拥有成熟的项目管理流程和质量控制体系，确保每个项目都能高质量、高效率地完成。通过深入理解客户业务流程和痛点，我们提供切实可行的技术解决方案，帮助企业提升运营效率和数据管理能力，实现业务流程的优化和数字化转型。
http://mip.jadxl.cn/

回复
pszfdzgiww
March 6th, 2025 at 04:50 pm

这篇文章不错！

回复
crkzddkkso
March 6th, 2025 at 04:47 pm

这篇文章不错！

回复
fcsuuwkcps
February 28th, 2025 at 06:55 pm

作者的情感表达细腻入微，让人在阅读中找到了心灵的慰藉。

回复
qcoavomtpk
February 28th, 2025 at 02:47 pm

?议论文评语?

回复
cqvzjbsdlp
February 28th, 2025 at 02:33 pm

建议增加田野调查素材，提升真实性。

回复
cphgrwihtb
November 28th, 2024 at 04:52 pm

你的文章让我感受到了快乐，每天都要来看一看。 https://www.4006400989.com/qyvideo/99516.html

回复
ezbanmlkoa
November 27th, 2024 at 05:26 pm

你的文章让我感受到了艺术的魅力，谢谢！ https://www.4006400989.com/qyvideo/89239.html

回复
vxqchgqvdj
November 26th, 2024 at 10:42 am

《一席之地第二季》大陆综艺高清在线免费观看：https://www.jgz518.com/xingkong/54951.html

回复
saihsxosfn
November 24th, 2024 at 05:17 pm

《爆笑虫子在中国》欧美动漫高清在线免费观看：https://www.jgz518.com/xingkong/13398.html

回复
kglncvvydr
November 23rd, 2024 at 10:02 am

你的文章让我心情愉悦，真是太棒了！ http://www.55baobei.com/uM7z3Ffmr2.html

回复
gpedvvutth
November 21st, 2024 at 09:37 am

你的才华横溢，让人敬佩。 https://www.yonboz.com/video/84924.html

回复
cqqegiyosl
November 15th, 2024 at 10:10 am

你的文章内容非常专业，让人佩服。 https://www.4006400989.com/qyvideo/96321.html

回复
pktyxjtfqq
November 13th, 2024 at 01:48 am

《逆转奇兵第二季》欧美剧高清在线免费观看：https://www.jgz518.com/xingkong/111716.html

回复
nvcpnayjju
November 12th, 2024 at 09:55 am

你的文章总是能给我带来欢乐，谢谢你！ http://www.55baobei.com/KVuYlXIgI2.html

回复
cidkdwwrkn
October 6th, 2024 at 11:40 am

想想你的文章写的特别好www.jiwenlaw.com

回复
mtdddewwxy
September 22nd, 2024 at 09:46 pm

叼茂SEO.bfbikes.com

回复
olujnikway
September 22nd, 2024 at 11:00 am

博主真是太厉害了！！！

回复