1、統(tǒng)計(jì)學(xué)目前有一種趨勢(shì)是越來(lái)越精確。當(dāng)然,這本身并不是壞事,只有越精確才能避免錯(cuò)誤,發(fā)現(xiàn)真理。
統(tǒng)計(jì)學(xué)在采用一個(gè)方法之前先要證明,而不是像計(jì)算機(jī)科學(xué)和機(jī)器學(xué)習(xí)那樣注重經(jīng)驗(yàn)。有時(shí)候同一問(wèn)題的其它領(lǐng)域的研究者提出一個(gè)很明顯有用的方法,但它卻不能被統(tǒng)計(jì)學(xué)家證明(或者現(xiàn)在還沒(méi)有證明)。
統(tǒng)計(jì)學(xué)更傾向于經(jīng)過(guò)數(shù)學(xué)證明的方法而不是一些特殊方法。但統(tǒng)計(jì)學(xué)的核心問(wèn)題就是在觀察了樣本的情況下如何去推斷總體。當(dāng)然這也常常是大數(shù)據(jù)挖掘所關(guān)注的。
2、大數(shù)據(jù)技術(shù)作為幾門(mén)學(xué)科的綜合,已經(jīng)從機(jī)器學(xué)習(xí)那里繼承了實(shí)驗(yàn)的態(tài)度。這并不意味著大數(shù)據(jù)工作者不注重精確,而只是說(shuō)明如果方法不能產(chǎn)生結(jié)果的話就會(huì)被放棄
數(shù)據(jù)挖掘的一個(gè)特定屬性就是要處理的是一個(gè)大數(shù)據(jù)集。這就意味著,傳統(tǒng)統(tǒng)計(jì)學(xué)由于可行性的原因,我們常常得到的只是一個(gè)樣本,但是需要描述樣本取自的那個(gè)大數(shù)據(jù)集。然而,數(shù)據(jù)挖掘問(wèn)題常常可以得到數(shù)據(jù)總體,例如關(guān)于一個(gè)公司的所有職工數(shù)據(jù),數(shù)據(jù)庫(kù)中的所有客戶(hù)資料,去年的所有業(yè)務(wù)。在這種情形下,統(tǒng)計(jì)學(xué)的推斷就沒(méi)有價(jià)值了。
想要了解更多關(guān)于大數(shù)據(jù)資訊信息,請(qǐng)關(guān)注中培偉業(yè)李老師二維碼: