Taiwan Hadoop Ecosystem Workshop 2014 Q1

|
  • 活動名稱:Taiwan Hadoop Ecosystem Workshop 2014 Q1
         台灣 Hadoop 生態系工作坊 2014 Q1
  • 活動時間:2014/03/08 (六) 10:30~16:10
  • 活動地點:關貿網路訓練教室 @ 南港軟體工業園區一期 E 棟七樓
         (台北市南港區三重路 19-13 號,地圖 Map
  • 報名網址:http://goo.gl/Yy1ZdD
  • 活動名額:開放 60 名座位,依實際報到為準。
  • 活動費用:本活動不收取費用,感謝關貿網路贊助場地。
  • 活動議程:
議程表
時段 講題 講者
10:00-10:30 報到時間
10:30-11:50 Impala資料倉儲應用案例分享 陳俊光/李民祥/黃勁超 , 關貿網路
11:50-12:00 休息(午餐自理)
13:30-14:10 SQL on HBase : Hare 鄭紹志 , 亦思科技
14:10-14:50 Network Traffic Search using Apache HBase 葉祐欣 , 趨勢科技 SPN
14:50-15:10 中場休息
15:10-15:30 [閃電講] 探討如何用 Mahout 分析網路流量 Raymond , systw.net 站長
15:30-15:50 [閃電講] Develop a game community mining system by big data technology A-Len, Gamania
15:50-16:10 [新商業模式] 他山之石 - 從日誌蒐集到線上分析
- Live Demo: Treasure Data Cloud
Jazz Wang, Etu

  • 時段:10:30 - 11:50
  • 講題:Impala資料倉儲應用案例分享
  • 講者:陳俊光 / 李民祥 / 黃勁超 , 關貿網路
  • 摘要:
     PART A: Why impala ? (20 min)
         1. SQL on Hadoop 的需求
         2. Impala 的介紹(發展歷程、架構、功能、特色)
    
     PART B: Impala在資料分析與資料倉儲(DW)的應用 (40 min)
         1. DW (Before and After)
         2. Impala 大數據資料倉儲 (應用架構, 用法:資料注入與轉換 等)
         3.購物籃分析實例為例與 Demo
    
     PART C: 分享與總結 (20min ~)
         1. 心得分享
         2. 相關議題 
         3. Q&A (Open Discussion)
    

  • 11:50-12:00 午餐:自理

  • 時段:13:30~14:10
  • 講題:SQL on HBase : Hare
  • 講者:鄭紹志 , 亦思科技

  • 時段:14:10~14:50
  • 講題:Network Traffic Search using Apache HBase
  • 講者:葉祐欣 , 趨勢科技 SPN

  • 14:50-15:10 中場休息

  • 時段:15:10-15:30
  • 講題:[閃電講] 探討如何用 Mahout 分析網路流量
  • 講者:Raymond , systw.net 站長
  • 摘要:
    在資料量無限,計算資源有限的情況下,平常看網路流量頂多就是看那個 IP 的用量大,那個 IP 去那邊等,但是當計算資源可無限擴大並有現成 Data Mining 工具可用時,是時候來開始研究一下,如何應用在網路流量分析並看到更多有用的資訊。
    

  • 時段:15:30-15:50
  • 講題:[閃電講] Develop a game community mining system by big data tech.
  • 講者:A-Len, Gamania
  • 摘要:
    遊戲產業是一個方向變動很快速的地方,以台灣而言,從 1990 年代左右,單機遊戲 -> Online Game -> Web Game -> APP ,才短短二十年時間,台灣人喜歡的遊戲產品就經歷了四次重大的目標轉換。是否我們有辦法利用 Big Data 的理念和技術,分析我們的顧客以至於去猜測下一階段會賺錢的產品呢? 分享給大家我這兩年來一些在公司實作的成果和想法。
    

  • 時段:15:50-16:10
  • 講題:[新商業模式] 他山之石 - 從日誌蒐集到線上分析
    - Live Demo: Treasure Data Cloud
  • 講者:Jazz Wang, Etu
  • 摘要:
    過去我曾在一些場合演講過巨量資料的五大階段「蒐、存、取、析、用」。Etu 蔣居裕副總也用「生、流、存、算、用、看」六個階段來說明巨量資料的動態特徵。根據這幾年推動社群得到一個結論,大家已經知道可以用 Hadoop Ecosystem 來「存」、「取」、「析」。可是「生」、「流」、「蒐」該怎麼做呢?分析完以後該怎麼視覺化,產生應用呢?甚至產生了視覺化該怎麼「看」(解讀)呢?這次閃電講想跟大家分享一個「他山之石」,Treasure Data 是 Flunetd 背後的開發公司,他們最近主打一個雲端服務,稱為 Treasure Data Cloud,且讓我跟大家解析一下這背後可能的組成元素。