<th id="tllh3"><meter id="tllh3"></meter></th><track id="tllh3"></track>
    <cite id="tllh3"><dfn id="tllh3"></dfn></cite>

        <video id="tllh3"></video>

          大數據應用案例.docx

          1. 1、本文檔共9頁,可閱讀全部內容。
          2. 2、本文檔內容版權歸屬內容提供方,所產生的收益全部歸內容提供方所有。如果您對本文有版權爭議,可選擇認領,認領后既往收益都歸您。
          3. 3、本文檔由用戶上傳,本站不保證質量和數量令人滿意,可能有諸多瑕疵,付費之前,請仔細先通過免費閱讀內容等途徑辨別內容交易風險。如存在嚴重掛羊頭賣狗肉之情形,可聯系本站下載客服投訴處理。
          4. 文檔侵權舉報電話:400-050-0739(電話支持時間:9:00-19:00)。
          大數據應用案例 四大經典大數據應用案例解析 什么是數據挖掘(Data Mining)?簡而言之,就是有組織有目的地收集數據,通過分析數據使之成為信息,從而在大量數據中尋找潛在規律以形成規則或知識的技術。在本文中,我們從數據挖掘的實例出發,并以數據挖掘中比較經典的分類算法入手,給讀者介紹我們怎樣利用數據挖掘的技術解決現實中出現的問題。 數據挖掘是如何解決問題的? 本節通過幾個數據挖掘實際案例來詮釋如何通過數據挖掘解決商業中遇到的問題。下面關于“啤酒和尿不濕”的故事是數據挖掘中最經典的案例。而Target公司通過“懷孕預測指數”來預測女顧客是否懷孕的案例也是近來為數據挖掘學者最津津樂道的一個話題。 Target能夠通過分析女性客戶購買記錄,“猜出”哪些是孕婦。他們從Target的數據倉庫中挖掘出25項與懷孕高度相關的商品,制作“懷孕預測”指數。比如他們發現女性會在懷孕四個月左右,大量購買無香味乳液。以此為依據推算出預產期后,就搶先一步將孕婦裝、嬰兒床等折扣券寄給客戶來吸引客戶購買。 如果不是在擁有海量的用戶交易數據基礎上實施數據挖掘,Target不可能做到如此精準的營銷。 三、電子商務網站流量分析 網站流量分析,是指在獲得網站訪問量基本數據的情況下對有關數據進行的統計和分析,其常用手段就是Web挖掘。Web挖掘可以通過對流量的分析,幫助我們了解Web上的用戶訪問模式。那么了解用戶訪問模式有哪些好處呢? 在技術架構上,我們可以合理修改網站結構及適度分配資源,構建后臺服務器群組,比如輔助改進網絡的拓撲設計,提高性能,在有高度相關性的節點之間安排快速有效的訪問路徑等。 幫助企業更好地設計網站主頁和安排網頁內容。 幫助企業改善市場營銷決策,如把廣告放在適當的Web頁面上。 幫助企業更好地根據客戶的興趣來安排內容。 幫助企業對客戶群進行細分,針對不同客戶制定個性化的促銷策略等。 人們在訪問某網站的同時,便提供了個人對網站內容的反饋信息:點擊了哪一個鏈接,在哪個網頁停留時間最多,采用了哪個搜索項、總體瀏覽時間等。而所有這些信息都被保存在網站日志中。從保存的信息來看,網站雖然擁有了大量的網站訪客及其訪問內容的信息,但擁有了這些信息卻不等于能夠充分利用這些信息。 那么如果將這些數據轉換到數據倉庫中呢?這些帶有大量信息的數據借助數據倉庫報告系統(一般稱作在線分析處理系統),雖然能給出可直接觀察到的和相對簡單直接的信息,卻也不能告訴網站其信息模式及怎樣對其進行處理,而且它一般不能分析復雜信息。所以對于這些相對復雜的信息或是不那么直觀的問題,我們就只能通過數據挖掘技術來解決,即通過機器學習算法,找到數據庫中的隱含模式,報告結果或按照結果執行。為了讓電子商務網站能夠充分應用數據挖掘技術,我們需要采集更加全面的數據,采集的數據越全面,分析就能越精準。在實際操作中,有以下幾個方面的數據可以被采集: 訪客的系統屬性特征。比如所采用的操作系統、瀏覽器、域名和訪問速度等。 訪問特征。包括停留時間、點擊的URL等。 條款特征。包括網絡內容信息類型、內容分類和來訪URL等。 產品特征。包括所訪問的產品編號、產品目錄、產品顏色、產品價格、產品利潤、產品數量和特價等級等。 當訪客訪問該網站時,以上有關此訪客的數據信息便會逐漸被積累起來,那么我們就可以通過這些積累而成的數據信息整理出與這個訪客有關的信息以供網站使用??梢哉沓尚偷男畔⒋笾驴梢苑譃橐韵聨讉€方面: 訪客的購買歷史以及廣告點擊歷史。 訪客點擊的超鏈接的歷史信息。 訪客的總鏈接機會(提供給訪客的超級鏈接)。 訪客總的訪問時間。 訪客所瀏覽的全部網頁。 訪客每次會話的產出利潤。 訪客每個月的訪問次數及上一次的訪問時間等。 訪客對于商標總體正面或負面的評價。 四、分類:從人臉識別系統說起 美國電視劇《反恐24小時》中有一集,當一個恐怖分子用手機撥打了一個電話,從CTU(反恐部隊)的計算機系統中便立刻發出恐怖分子出現的預警。很多好萊塢的大片中此類智能系統的應用也比比皆是,它能從茫茫人群中實時找出正在苦苦追蹤的恐怖分子或間諜。而在2008年北京奧運會上,最引人注意的IT 熱點莫過于“實時人臉識別技術”在奧運會安檢系統中的應用,這種技術通過對人臉關鍵部位的數據采集,讓系統能夠精確地識別出所有進出奧運場館的觀眾身份。 目前人臉識別技術正廣泛的應用于各種安檢系統中,警方只需將犯罪分子的臉部數據采集到安檢數據庫,那么只要犯罪分子一出現,系統就能精確地將其識別出來?,F如今人臉識別技術已經相對成熟,谷歌在Picasa照片分享軟件的工具中就已經加入了人臉識別功能。當然,人臉識別技術牽涉到隱私,是把雙刃劍,谷歌在谷歌街景地圖中故意將人臉模糊化,變得無法識別就是這個原因。如圖所示為人臉識別示意圖。 人臉識別示意圖 雖然需要借力于其他技術,

          您可能關注的文檔

          文檔評論(0)

          185****9651

          相關文檔

          相關課程推薦