日本午夜一区二区三区,久久久a级片,亚洲精品一二三四五区,久久久久久久麻豆,农村艳妇疯狂做爰肥水不流外田 ,999九九九久久久,伊人av在线,中文一区二区在线观看
          首頁 | 深度閱讀

          大數據思維養成從認識大數據的本質開始

          電力網
          2020-04-26
          瀏覽:
            踐行數據的商業價值,理解大數據的本質,從哪里開始?應該從認識不確定性開始。

            什么是不確定性

            什么是不確定性?打個比方,老王、老李做一個游戲“猜花生米”。老王出一只拳頭,讓老李猜里面是空的還是抓了一粒花生米。這個事件對老王而言是確定性事件,因為老王自己有沒有抓花生米,他心知肚明。這個事件對猜拳的老李來說就是不確定性事件,因為老李無法對老王的猜拳決策做出絕對準確的預測。

            在實際生活中,不確定性事件廣泛存在。事實上,人生就是由一系列或大或小的不確定性事件構成的。婚姻選擇有著極大的不確定性。一對相愛的男女是否應該接受對方成為自己的終身伴侶,這是一個重大選擇。這個選擇的后果是什么?是幸福的遠航,還是痛苦的開始?這有很大的不確定性。為了極小化這種不確定性,青年男女往往需要一場死去活來的戀愛,以便充分暴露雙方的優點和缺點,以減少未來婚姻中的不確定性。但是,無論你如何了解,這種不確定性仍然存在。

            世界到處都充滿了不確定性,那我們對未來的世界認識是不是不可知的?答案是否定的。世界上很多事情是難以用確定的公式或者規則來表示,但是這種不確定性并不是無規律可循,這個時候就需要用到統計學中的概率模型來描述。在概率論的基礎上,信息論鼻祖香農博士建立了一套完整的理論,將世界的不確定性和信息聯系起來,這就是信息論,用來解釋不確定性的世界。

            信息可消除不確定性

            什么是信息?在看《暗時間》時(推薦大家看看),里面討論了一些信息論相關的內容,于是就嘗試搜索信息論和不確定性的關系,結果發現香農說了這么一句話:“信息是用來消除不確定性的東西”。信息論的鼻祖果然是鼻祖,一句話解釋了信息。

            信息是否可以被度量?如何度量信息?1948年,香農提出了“信息熵”這個概念,解決了信息度量的問題。他指出,信息量與不確定性有關:假如我們需要搞清楚一件非常不確定的事情,或者我們一無所知的事情,就需要收集大量的信息。相反,如果我們對某件事已經有了較多的了解,那么不需要太多的信息就能把它搞清楚。從這個角度來看,信息量的度量就是不確定性的多少。

            舉例說明,就拿互聯網廣告來說,在門戶網站上投放展示類的品牌廣告,點擊率是非常低的。因為對于受眾用戶,廣告投放時幾乎是隨機猜測用戶的需求,很不準確。而搜索廣告因為有用戶輸入的關鍵詞,準確率會大幅度提高,至于提高多少,取決于關鍵詞所提供的信息量。這就是搜索廣告所賺到的廣告費用要高出展示廣告兩個數量級。通過這個例子,也能說明,信息時代,誰掌握了更多的信息,誰就掌握了更多財富的可能性。

            大數據與信息的關系

            了解大數據的人,都可能知道,大數據有5V特點,這是IBM提出來的:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。但從信息論的角度,大數據通常是具備三個主要特征,數據量大,多樣性和完備性。

            1、大數據的體量足夠大

            大數據最明顯的特點就是體量大,這一點無論是內行還是外行都認可,沒什么異議。我們國家僅僅北京的國家超級大數據中心,占地面積就8萬平方米,包含9棟數據中心機房和1棟感知體驗中心。

            但是,過去由于數據量不夠,即使用了數據,依然不足以消除不確定性,因此數據的作用其實有限,很多人忽視它的重要性是必然的,數據的價值也就被嚴重低估。在那種情況下,哪個領域先積攢下足夠的數據,它的研究進展就顯得快一些。語音識別領域,就是因為早期積攢了大量的音頻數據,才可以捷足先登,第一批嘗到了數據驅動方法的甜頭。

            2、大數據的多維度足夠多

            眾所周知,Google的人工智能已經走在了前沿,也是目前全球估值最高的公司。但是,無論是AlpahaGo、無人駕駛還是IT醫療公司Calico,都是建立在多維度的大數據基礎之上的。例如關于“食物”這個問題,Google會利用用戶輸入的信息,收集所有相關的信息。不僅涉及到食物的做法、吃法、成分、營養價值、價格、問題來源的地域和時間等維度。

            大數據的多維度,統計學中稱為相關性,信息論中稱為互信息。互信息,它在信息論中,實現了對信息相關性的度量。比如“央行調整利率”和“股市短期波動”的互信息很大,這就證實了兩者具備強相關性。第二個視角,交叉驗證。舉例說明,夏天的時候,“空氣濕度高”和“24小時內要下雨”之間的互信息比較大。也就是說空氣濕度高,24小時下雨的可能性比較大,但并不能說空氣濕度高就一定會在24小時內下雨。還需要結合氣壓信息,云圖信息等其他緯度的信息,來交叉驗證“24小時內要下雨”這件事情,那么預測的準確性要高的多。

            3、大數據的完備性

            要理解它,需要介紹信息論中的一個重要概念—交叉熵。它可以反映兩個信息源之間的一致性,或者兩種概率模型之間的一致性。當兩個數據源完全一致的時候,其交叉熵為0,當它們相差很大時,它們的交叉熵也很大。因此,所有數據驅動的方法,建立模型使用的數據和使用模型的數據需要有一致性。

            抽樣調查方式都是采用抽取有限的樣本進行統計,從而得出整體的趨勢。抽樣的核心原則是隨機性,不隨機就不能真實地反應整體的趨勢。但是要做到隨機性是很難的。例如電視收視率調查,要從不同階層隨機找被調查的人,但高學歷高收入的大忙人們普遍拒絕被調查,他們根本就不會因為幾個蠅頭小利而浪費時間,電視調查的結果就可想而知。

            所以,在過去,任何使用概率統計模型都會有很多小概率事件是覆蓋不到的。大數據時代以前,這是數據驅動方法的死穴。

            在大數據時代,在某個領域獲得數據的完備性還是有可能的,Google的機器翻譯系統就能很好的要利用大數據的完備性。通過數據學到了不同語言之間很長句子成分的對應,然后直接把一種語言翻譯成另一類,前提條件就是使用的數據必須是比較全面地覆蓋中文、英文,以及其他各種語言的所有句子,也就是說具備兩種語言之間翻譯的完備性。

            當數據的完備性具備了以后,就相當于訓練模型的數據集合和使用這個模型的測試集合是同一個集合,或者是高度重復的。這樣的數據驅動方法才是有效的。

            由此可見,大數據的科學基礎是信息論,它的本質就是利用信息消除不確定性。

            ——以上內容部分是源自于吳軍老師《智能時代》的讀書筆記。


          作者: 電力數字化智能化網站
          中國電力年鑒

          推薦閱讀

          評論

          用戶名:    匿名發表
          密 碼:
          驗證碼: 
          最新評論(0
          主站蜘蛛池模板: 国产精品96久久久久久久| 91久久国产露脸精品国产护士| 国产欧美三区| 国产精品一区二区在线观看免费| 国产丝袜在线精品丝袜91| 亚洲国产欧洲综合997久久, | 92久久精品| 狠狠色噜噜狠狠狠888奇米| 亚洲国产另类久久久精品性| 午夜影院试看五分钟| 日本激情视频一区二区三区| 68精品国产免费久久久久久婷婷| 在线观看欧美一区二区三区| 手机看片国产一区| 国产精品高清一区| 欧美日韩一区二区三区不卡| 亚洲高清久久久| xx性欧美hd| 岛国黄色网址| 精品国产乱码久久久久久影片| 久久久久久亚洲精品中文字幕| 欧美在线一区二区视频| 久久国产精品免费视频| 久久精品99国产国产| 美女脱免费看直播| 午夜av资源| 午夜影院5分钟| 综合在线一区| 99久久国产免费,99久久国产免费大片| 午夜影院黄色片| 亚洲欧洲国产伦综合| 综合久久国产九一剧情麻豆| 91日韩一区二区三区| 国产区二区| 国产理论片午午午伦夜理片2021 | 国产欧美日韩在线观看| 久久99国产精品久久99果冻传媒新版本| 偷拍自中文字av在线| 日韩亚洲精品视频| 久久精品国产精品亚洲红杏| 日韩一区免费| 国产精品视频久久久久久 | 素人av在线| 欧美精品免费一区二区| 日本亚洲国产精品| 国产一区二区视频免费在线观看| 色婷婷噜噜久久国产精品12p| 国产一级在线免费观看| 午夜影院你懂的| freexxxxxxx| 国产97久久| 国产大学生呻吟对白精彩在线| 91一区二区三区久久国产乱| 欧美日韩一区二区三区不卡| 99精品国产一区二区三区不卡| 天堂av一区二区| 91精品国产一区二区三区| 国产精品久久久区三区天天噜| 日韩精品一区二区免费| 午夜看片网址| 日韩av一二三四区| 一区二区在线精品| 欧美精品xxxxx| 国产精品一区不卡| 亚洲va国产| 国产videosfree性另类| 精品国产乱码一区二区三区在线| 91国产一区二区| 日本美女视频一区二区三区| 国产一级二级在线| 久久久精品中文| 日韩区欧美久久久无人区| 日本一区午夜艳熟免费| 中文在线一区| 91午夜在线观看| 亚洲国产视频一区二区三区| 精品国产91久久久久久久| 狠狠色噜噜狼狼狼色综合久| 素人av在线| 国产91电影在线观看| 亚洲精品少妇久久久久| 国产视频二区| 国产精品一品二区三区四区五区| 538国产精品一区二区| 色乱码一区二区三区网站| 天堂av一区二区| 91午夜在线| 国产第一区在线观看| 国产一区二区三区影院| 四虎久久精品国产亚洲av| 日韩夜精品精品免费观看| 999久久久国产精品| 右手影院av| 国产69精品久久久久777糖心| 国产精品综合在线| 91一区二区三区视频| 在线播放国产一区| 国产一级自拍片| 国产精品一区亚洲二区日本三区 | 午夜伦理在线观看| 99久久久国产精品免费调教网站 | 二区三区免费视频| 久久九九国产精品| 少妇太爽了在线观看免费| 国产欧美一区二区三区精品观看| 国产精品69久久久| 午夜特级片| 国产一区二区中文字幕| 国产美女三级无套内谢| 狠狠色狠狠色合久久伊人| 热re99久久精品国99热蜜月| 亚洲欧美一区二区三区1000| 91人人精品| 国产精品久久久av久久久| 亚洲国产精品一区二区久久,亚洲午夜| 久久午夜鲁丝片| 欧美一区二区三区三州| 国产伦精品一区二区三区免费优势| 亚洲区在线| 国产电影精品一区| 精品一区二区三区中文字幕| 97精品久久人人爽人人爽| 久久国产精久久精产国| 欧美一区二区色| 精品videossexfreeohdbbw| 97精品国产97久久久久久| 91中文字幕一区| 国产午夜精品一区二区三区四区 | 91国产一区二区| 中文乱幕日产无线码1区| 国产精品天堂网| 亚洲精品www久久久| 亚洲一区二区国产精品| 日本精品一区二区三区视频| 精品久久久久久中文字幕大豆网| 国内久久久久久| 91热国产| 日韩亚洲精品在线观看| 91精品久| 亚洲制服丝袜中文字幕| 国产亚洲精品久久久久久网站| 97一区二区国产好的精华液| 精品一区二区在线视频| 色一情一乱一乱一区99av白浆| 国产69精品久久久久9999不卡免费 | 国产69精品久久久久app下载| 中文无码热在线视频| 亚洲欧洲一区二区| 国产精品久久久久久久久久不蜜臀| 国产精品综合久久| 国产丝袜一区二区三区免费视频 | 91影视一区二区三区| 国产视频在线一区二区| 日本不卡精品| 国产一区二区伦理| 欧美二区精品| 91精品国产综合久久婷婷香| 国产精品日产欧美久久久久| 久久天堂国产香蕉三区| 国产精品伦一区二区三区视频| 国产极品一区二区三区| 日韩av在线中文| 欧美日韩一区二区三区不卡视频| 国内久久久久久| 国产精品一区在线播放| 国产精品久久久久久久久久久新郎 | 欧美精品六区| 日韩精品午夜视频| 欧美在线播放一区| 国产91在线拍偷自揄拍| 午夜色大片| 日本高清不卡二区| 亚洲欧洲精品一区二区三区不卡| 国产区一区| 亚洲少妇中文字幕| 国产91电影在线观看| 亚洲少妇一区二区| 久久两性视频| 日本五十熟hd丰满| 91久久一区二区| 国产性生交xxxxx免费| 午夜天堂电影| 亚洲乱亚洲乱妇28p| 国产性猛交| 久久免费视频99| 久久91精品国产91久久久 | 男女午夜影院| 日韩欧美国产高清91| 国产一区二区免费电影| 99精品小视频| 亚洲欧洲精品一区二区三区不卡| 欧美精品一区免费| 久久九九亚洲| 99国产精品欧美久久久久的广告| 996久久国产精品线观看| 99日本精品| 欧美国产三区| free性欧美hd另类丰满| 国产主播啪啪| 97人人模人人爽人人喊0| 精品一区中文字幕| 亚洲精品主播| 国产精品日韩一区二区| 亚洲精品丝袜| 欧美一区二区三区激情视频| 国产在线拍偷自揄拍视频| 欧美精品一区二区性色| 欧美精品第一区| 国内少妇偷人精品视频免费| 国产在线卡一卡二| 日韩精品中文字幕在线| 久久不卡精品| 欧美一区二区三区黄| 日本道欧美一区二区aaaa| 91一区二区在线观看| 国产乱对白刺激视频在线观看 | 午夜社区在线观看| 国产精品6699| 亚洲欧美一区二区三区1000| 久久网站精品| 一区二区中文字幕在线| 国产精品不卡在线| 6080日韩午夜伦伦午夜伦| 亚洲一二三在线| 国产一级片子| 三级视频一区| 91性高湖久久久久久久久_久久99| 国产乱xxxxx97国语对白| 91嫩草入口| 午夜a电影| 亚洲精品丝袜| 国产精品一区二区日韩新区| 国产精品中文字幕一区| 国产99网站| 国产原创一区二区 | 欧美系列一区| 国产伦精品一区二区三区免费迷| 国产日本一区二区三区| 国产视频一区二区在线播放| 日本精品一二三区| 久久99精| 国产欧美日韩中文字幕| 日本一区二区欧美| 日韩欧美一区二区在线视频| 国产一级二级在线| 国产一区二区三区网站|