11 hours ago [长文手敲] 简论机器学习——机器学习之前,先学会看数据(其三)🌐 链接: https://linux.do/t/topic/2273579🔍 关键词: #抽奖🏷️ 分组: LinuxDo论坛🕒 时间: 2026-05-30 15:07:57 LINUX DO [长文手敲] 简论机器学习——机器学习之前,先学会看数据(其三) 看见数据关系,才算真正开始看数据 前两篇说了很多看数据之前该做的事。 先弄清楚数据从哪里来,字段代表什么,标签怎么定义,缺失值为什么缺,异常值到底是错误还是信号,训练集和测试集有没有互相串门,线上数据会不会和训练数据分道扬镳。 这些事情听起来麻烦,做起来折腾,是因为这些本来就是非常琐碎的工作,甚至有一个专门的信息集采和清洗的职业(工资都很低,别去尝试)。 但是在机器学习项目里,越基础的地方越容易埋雷。所谓千里之堤,溃于蚁穴,即便是一个不起眼的小洞,后面可能就是洪水滔天。 你以为自己只是随手跳过一…