新手在时最容的六种!

时间:2019-12-19 11:00:00
量:290
猎维w88优德中文版培训
本文列新手在做时最常犯的。你能从常见的中吸取教训,更健方案,的。

在中,有来构建或方案,都的东西。,识别是合理的并不明显。刚接触的人会犯,会愚蠢。本文列新手在做时最常犯的。能从常见的中吸取教训,更健方案,的。

默认的

均方大!这确实是一个的默认,中,的适合于你试图的问题。以检测。与商业保持一致,你想因而的比例来对假。使用均方会不,但永远不会最。

:建立一个自定义的,密切配合方案。

对问题使用/

人的第一个,并使用在用例中所的相同。它很,认为它和其他。一个糟糕的,将导致糟糕的。让为你模型。一旦你预了,把它到的模型中,是什么。你什么模型工和什么模型工好有一个很。

:你发现自己一次又一次地使用相同的,这意味着你最。

忽略离群点

离群点值很,也被忽略,这取决于上下文。以污染。空气污染会出现大的,并其是一个好主意。在的传感器导致的异常值的情况下,忽略中是的。从模型的来看,有些模型比其他模型对异常值更敏感。以Adaboost,异常值视为“”,异常值施加极大的,而决策树只异常值一个分类。

:在工作,一,应该忽略或更地离群值。

化或的常用

中的,一周中的,中的月,以及性的。新的工程师认为,不能将转形式,形式保存23和0的,彼此之间很近,也不远。的,问题的是计算sin和cos,(x,y)的圆来。在中,23和0在数字上是的,就像应该的。

:,而你转换,你模型。

做L1/L2化标准化

L1和L2化不利,是化或的常用,,工程师并意识到在化对标准化的性。一个以事务为的模型。标准化的,的基础上,化在上的。用,而用其他。

:化很好,你标准化,它会让你

将或的为性

为p值。新手认为模型,的值,越。的改的绝对值,所以这并是不正确的。是的,从一个转另一个。集的,越有是共的,对性的简单就越不可靠。

:什么对最是重,但你来,不会全貌。

做项目,,就像万。你工作,你很好,但就像其他行业,魔鬼中,甚至的和。列表并不是面面俱到的,让方案中的小问题。,过程是很重,要反复你犯常见的。

Baidu