丝袜久久亚洲国产毛片,老人AV综合,国产精品日韩av,超碰国产综合,综合av在线草,毛片久久久,精品蜜桃一区三区,99久久久,人妻99在线视频

決策樹是怎么產(chǎn)生的

2014-11-18 決策樹

展示量: 7632



 
  決策樹是對(duì)分類問題進(jìn)行深入分析的一種方法,在實(shí)際問題中,按算法生成的決策樹往往復(fù)雜而龐大,令用戶難以理解。這就告訴我們?cè)谥胤诸惥_性的同時(shí),也要加強(qiáng)對(duì)樹修剪的研究。
  隨著數(shù)據(jù)挖掘技術(shù)的逐步成熟,其算法的深入研究已成為當(dāng)前該領(lǐng)域的焦點(diǎn),決策樹方法作為數(shù)據(jù)挖掘領(lǐng)域重要算法之一,在分類規(guī)則中突現(xiàn)了它的優(yōu)勢(shì)。決策樹方法是從機(jī)器學(xué)習(xí)中引出的,它根據(jù)給定的訓(xùn)練樣本數(shù)據(jù)集來構(gòu)建分類模型,以樹的形式來表達(dá)模型。
  一般來說,決策樹是一個(gè)類似于流程圖的樹結(jié)構(gòu),其中每個(gè)節(jié)點(diǎn)表示在一個(gè)屬性上的測(cè)試,每個(gè)分枝代表一個(gè)測(cè)試輸出,每個(gè)樹葉節(jié)點(diǎn)代表類或類分布。決策樹的最頂層節(jié)點(diǎn)是根節(jié)點(diǎn)。更明確地說,決策樹通過根節(jié)點(diǎn)到葉節(jié)點(diǎn)的順序?qū)?shí)例進(jìn)行分類,其中每個(gè)節(jié)點(diǎn)代表一個(gè)屬性,每個(gè)分枝代表它所連接的上節(jié)點(diǎn)在其屬性上的可能取值。舉例來說,一個(gè)實(shí)例的分類是從樹的根節(jié)點(diǎn)開始,測(cè)試該節(jié)點(diǎn)所代表的屬性,然后沿屬性取值的某個(gè)分枝向下移動(dòng),不斷重復(fù)這個(gè)過程,直至到達(dá)葉節(jié)點(diǎn),即得到該實(shí)例所屬的類。
  機(jī)器學(xué)習(xí)領(lǐng)域研究對(duì)數(shù)據(jù)的歸納分類,主要集中在預(yù)測(cè)精確度方面。然而,在許多實(shí)際業(yè)務(wù)中,只有"數(shù)據(jù)的預(yù)測(cè)結(jié)構(gòu)更易于理解"的分類規(guī)則才易讓人接受,就象這個(gè)分類規(guī)則所解決的決策問題一樣讓人清楚明白。在機(jī)器學(xué)習(xí)和統(tǒng)計(jì)領(lǐng)域,決策樹歸納作為一種分類問題的解決方法正在被廣泛的研究。由于許多樹簡(jiǎn)化規(guī)則正在生成越來越簡(jiǎn)單和越來越小的決策樹,樹簡(jiǎn)化規(guī)則已經(jīng)成為繼預(yù)測(cè)精度之后的第二個(gè)研究焦點(diǎn)??偨Y(jié)樹簡(jiǎn)化技術(shù)的關(guān)鍵問題在于解決方法的多樣性。要駕御這種多樣性,可以將這些方法分為五類。類的建立是將樹歸納看作是對(duì)預(yù)想樹空間的即席狀態(tài)搜索。
  隨著數(shù)據(jù)挖掘技術(shù)的逐步成熟,其算法的深入行業(yè)研究已成為當(dāng)前該領(lǐng)域的焦點(diǎn),決策樹方法作為數(shù)據(jù)挖掘領(lǐng)域重要算法之一,在分類規(guī)則中突現(xiàn)了它的優(yōu)勢(shì)。
  (1)C&R 樹
  classification and regression trees 是一種基于樹的分類和預(yù)測(cè)方法,模型使用簡(jiǎn)單,易于理解(規(guī)則解釋起來更簡(jiǎn)明易),該方法通過在每個(gè)步驟最大限度降低不純潔度,使用遞歸分區(qū)來將訓(xùn)練記錄分割為組。然后,可根據(jù)使用的建模方法在每個(gè)分割處自動(dòng)選擇最合適的預(yù)測(cè)變量。如果節(jié)點(diǎn)中100% 的觀測(cè)值都屬于目標(biāo)字段的一個(gè)特定類別,則該節(jié)點(diǎn)將被認(rèn)定為“純潔”。目標(biāo)和預(yù)測(cè)變量字段可以是范圍字段,也可以是分類字段;所有分割均為二元分割(即分割為兩組)。分割標(biāo)準(zhǔn)用的是基尼系數(shù)(Gini Index)。
  (2)QUEST決策樹
  優(yōu)點(diǎn):運(yùn)算過程比C&R 樹更簡(jiǎn)單有效quick unbiased efficient statistical tree (快速無(wú)偏有效的統(tǒng)計(jì)樹)QUEST 節(jié)點(diǎn)可提供用于構(gòu)建決策樹的二元分類法,此方法的設(shè)計(jì)目的是減少大型 C&R 決策樹分析所需的處理時(shí)間,同時(shí)減小分類樹方法中常見的偏向類別較多預(yù)測(cè)變量的趨勢(shì)。預(yù)測(cè)變量字段可以是數(shù)字范圍的,但目標(biāo)字段必須是分類的。所有分割都是二元的。
 ?。?)CHAID決策樹
  優(yōu)點(diǎn)(chi-squared automatic interaction detection,卡方自動(dòng)交互檢測(cè)),通過使用卡方統(tǒng)計(jì)量識(shí)別最優(yōu)分割來構(gòu)建決策樹的分類方法
  1、可產(chǎn)生多分支的決策樹;
  2、目標(biāo)和預(yù)測(cè)變量字段可以是范圍字段,也可以是分類字段;
  3、從統(tǒng)計(jì)顯著性角度確定分支變量和分割值,進(jìn)而優(yōu)化樹的分枝過程(前向修剪);
  4、建立在因果關(guān)系探討中,依據(jù)目標(biāo)變量實(shí)現(xiàn)對(duì)輸入變量眾多水平劃分。
 ?。?)C5.0決策樹
  優(yōu)點(diǎn):執(zhí)行效率和內(nèi)存使用改進(jìn)、適用大數(shù)據(jù)集
  1、面對(duì)數(shù)據(jù)遺漏和輸入字段很多的問題時(shí)非常穩(wěn)健;
  2、通常不需要很長(zhǎng)的訓(xùn)練次數(shù)進(jìn)行估計(jì);工作原理是基于產(chǎn)生最大信息增益的字段逐級(jí)分割樣本;
  3、比一些其他類型的模型易于理解,模型推出的規(guī)則有非常直觀的解釋;
  4、允許進(jìn)行多次多于兩個(gè)子組的分割。
  決策樹方法并不適用于現(xiàn)實(shí)世界中的所有問題,根據(jù)管理學(xué)理論,它需要滿足下列條件時(shí)才能產(chǎn)生較優(yōu)的結(jié)果。
  首先,實(shí)例要用“屬性-值”的形式描述。具體講,實(shí)例是由一系列固定的屬性和值構(gòu)成:屬性的可能取值范圍比較小時(shí),決策樹的效果最好。
  其次,目標(biāo)類變量的可能取值是離散的。決策樹算法要求每個(gè)實(shí)例屬于某個(gè)類,最簡(jiǎn)單的情況是只存在兩個(gè)可能的目標(biāo)類取值,當(dāng)然也可以擴(kuò)充到兩個(gè)以上的可能取值。
  最后,訓(xùn)練樣本可以有錯(cuò)誤。即決策樹算法應(yīng)是健壯的,不僅訓(xùn)練樣本的目標(biāo)類可以有錯(cuò)誤,而且屬性值也可以有錯(cuò)誤。訓(xùn)練樣本數(shù)據(jù)的某個(gè)屬性可以包含缺失值。
  決策樹算法在分類規(guī)則中,通過訓(xùn)練樣本數(shù)據(jù)集即可構(gòu)建分類模型,但這并不適用于現(xiàn)實(shí)生活中的任何數(shù)據(jù),所以,在不滿足其條件時(shí),應(yīng)盡可能的創(chuàng)造條件,使其算法能夠準(zhǔn)確、快速的實(shí)施,使決策樹方法能更好的為數(shù)據(jù)挖掘領(lǐng)域服務(wù)。
知名風(fēng)險(xiǎn)投資公司
紅杉資本|瑞華投資|同創(chuàng)偉業(yè)|達(dá)晨創(chuàng)投|深創(chuàng)投|IDG|創(chuàng)東方|君聯(lián)資本|中科招商|經(jīng)緯中國(guó)|啟明創(chuàng)投|松禾資本|英特爾投資|優(yōu)勢(shì)資本|東方富海|天堂硅谷|九鼎投資|晨興創(chuàng)投|江蘇高科投|北極光創(chuàng)投|德同資本|凱雷投資|中國(guó)風(fēng)投|天圖資本|真格基金|DCM|IFC|凱鵬華盈|高盛投資|啟迪創(chuàng)投|戈壁|荷多投資|紀(jì)源資本|鼎暉投資|華平投資|金沙江投資|海納亞洲|永宣創(chuàng)投|險(xiǎn)峰華興創(chuàng)投|中投|海通開元|中信資本|力鼎資本|平安創(chuàng)新資本|天使灣創(chuàng)投|和君資本|祥峰集團(tuán)|招商湘江投資|元禾控股|力合創(chuàng)投|復(fù)星創(chuàng)富|陜西高投|光速創(chuàng)投|富達(dá)亞洲|成為資本|中信產(chǎn)業(yè)基金|GIC|基石資本|金茂資本|富坤創(chuàng)投|盈富泰克|重慶科投|鼎暉創(chuàng)投|北工投資|海富投資|招商局資本|新天域資本|中路集團(tuán)|摩根士丹利|青云創(chuàng)投|建銀國(guó)際|德豐杰|弘毅投資|CVC|藍(lán)馳創(chuàng)投|寬帶資本|秉鴻資本|金石投資|天創(chuàng)資本|證大投資|中經(jīng)合|信中利|蘭馨亞洲|淡馬錫|浙商創(chuàng)投|華睿投資|景林資產(chǎn)|摯信資本|高特佳|清科創(chuàng)投|華登國(guó)際|山東高新投|集富亞洲|騰訊|無(wú)錫創(chuàng)投|創(chuàng)新工場(chǎng)|智基創(chuàng)投|策源創(chuàng)投|軟銀中國(guó)|
創(chuàng)業(yè)聯(lián)合網(wǎng)是創(chuàng)業(yè)者和投資人的交流平臺(tái)。平臺(tái)擁有5000+名投資人入駐。幫助創(chuàng)業(yè)企業(yè)對(duì)接投資人和投資機(jī)構(gòu),同時(shí)也是創(chuàng)業(yè)企業(yè)的媒體宣傳和交流合作平臺(tái)。
我想找投資人 我想發(fā)布信息
Copyright©創(chuàng)業(yè)聯(lián)合網(wǎng) ALL Rights Reserved
滬ICP備2024089025號(hào)-2
商務(wù)與客服聯(lián)系微信
兴城市| 灵石县| 塔城市| 行唐县| 孝感市| 山东省| 曲水县| 南丹县| 天长市| 渭南市| 天津市| 客服| 广昌县| 高唐县| 浮山县| 增城市| 钟山县| 营口市| 四会市| 黎平县| 安福县| 祁阳县| 买车| 五莲县| 班戈县| 原阳县| 斗六市| 伊宁县| 溆浦县| 南昌县| 壶关县| 福鼎市| 星座| 松滋市| 桑植县| 全椒县| 石渠县| 滦南县| 陆川县| 商南县| 枣庄市|