統計與機率

出自六年制學程
跳轉到: 導覽搜尋

基本架構

  1. 蒐集數據
  2. 演算
  3. 預測

有一點像算命

用途

  • 賭博與賭博設計
  • 保險,風險管理
  • 投資理財:但無法改變「高風險、高獲利」的法則
    1. 定存:獲利率 < 2% ,只夠抵消通貨膨脹。
    2. 大型年金:獲利率須達 4% ~ 5%,且採複利投資才能平衡。
    3. 股票:長期平均獲利率可以到 7%~10% ,但你不知道那一家公司能屹立不倒。
  • 幾乎每一件事(大數據)
    1. 百貨公司
      有一天,百貨公司寄了一份嬰兒用品型錄給你未婚的女兒。你認為這是對你女兒的侮辱,所以怒氣沖沖地打電話到百貨公司客服部抱怨,請他們以後不要再做這種事了。你抱怨完,卻看到女兒興味盎然地翻著型錄,原來她已經懷孕了。
      百貨公司比爸爸更早知道女兒懷孕的消息,不是黑色幽默,而是塔吉特(Target)百貨真實發生的事件。塔吉特怎麼知道顧客懷孕了?說穿了並不神奇,因為該公司設有準媽媽禮物登記處,讓準媽媽們登記自己想要的嬰兒禮物。由於這份清單等於確知已懷孕的顧客名單,塔吉特便依據名單上的消費紀錄,建立起懷孕婦女的購物模式(孕期會購買的商品清單),再用此模型比對其他客人的消費紀錄,找出消費形態類似的顧客,向她們行銷相關商品,達成「未卜先知」的結果。運用這個方法,塔吉特多找出了30%的行銷對象。
    2. 傳染病散布途徑:
      Google 在 2008 年推出流感趨勢預測,藉由統計關鍵字的搜尋次數,就能預測全球各地的流感疫情發展,不僅資訊更即時,準確率甚至超過政府的預警系統,Google 以此首開大數據(Big data,又稱巨量資料)應用到醫療領域的創舉,不僅讓其他幾家搜尋引擎紛紛跟進,如中國互聯網巨頭百度(Baidu),近日宣布與中國疾病預防控制中心合作,利用大數據預測流感疫情。
      加拿大拜歐迪(Bio Diaspora)公司,是全世界第一家運用大數據(Big Data)技術,結合地理資訊系統(Geographic Information System,GIS),分析歸納出病毒擴散的途徑,繪出一張張「病毒地圖」,進而預測出下一個可能爆發大規模感染區域的公司。 來自傳染病界、氣候學界、生物工程學界等不同領域的專家齊聚在此,嚴密監控著50多種致命病毒的動向。它是世界衛生組織(WHO)、美國疾管局、歐盟疾管局等全球各地來的求救對象。
    3. 社會風氣:若將 Google 搜尋引擎與 Twitter 結合,還能精準看出一些社會風氣的變化。兩位美國經濟學家結合兩者資訊,發現當《16歲懷孕》和《小媽咪》兩部美國影集播放時,青少年懷孕生子數比例大幅降低。
    4. 解除治理走向「暴政」的兩大根本限制:透過機器人、物聯網、大數據使政府可以得到無限量供應的忠誠武裝人員,並且能猜到人民想幹什麼。

名詞

  • 樣本:蒐集起來觀察,準備用來演算、推論、預測的數據
  • 平均數:所有樣本加起來/樣本個數
  • 眾數:樣本中出現最多的數
  • 中數或中位數:把所有觀察值按高低排序,位在正中間的數
    1. 找本班身高的平均數、眾數、中位數
    2. 找本班BMI的平均數、眾數、中位數
  • 大數法則:
    1. 偶然中包含著必然。
    2. 樣本數量越多,則其平均就越趨近期望值。
    3. 對物理量的測量實踐中,測定值的算術平均也具有穩定性。
      以擲單個骰子的過程來展示大數定律。隨著投擲次數的增加,所有結果的均值趨於3.5(骰子點數的期望值)。在投擲數量較小的時候(左邊)會表現得比較不準,當數量變得很大(右邊)的時候,它們將會很準。
      本班的丟骰子實驗
  • 期望值:按理應該出現的值,如
    1. 單顆骰子點數的期望值是1*⅙+2*⅙+3*⅙+4*⅙+5*⅙+6*⅙=3.5
      注意:3.5不屬於 1~6 六種可能結果中的任一個,所以期望值不是期望出現的結果。
    2. 彩券獎金的期望值
  • 全距:最大數-最小數
  • 標準差:
    1. 算出平均值
    2. 所有(樣本值-平均值)2加起來
    3. 除以樣本個數
    4. 開平方
  • 常態分布:

用棋盤方格法計算機率

以基測題目來理解觀念

誤用

  • 誤把獨立事件當成不獨立事件思考

動畫電影蒐集資料

  • 蒐集資料
  • 離線試算表:
    1. 剪貼資料到試算表
    2. 修整整齊
    3. 到插入去插入「樞鈕分析表」
    4. 先勾後拉,拉入欄標籤、列標籤、值
    5. 拉一些圖表
    6. 寄給丁丁
  • WPS office App:
    1. 開 WPS
    2. 按 「+」
  • 線上試算表(以 google 為例):
    1. 剪貼資料到試算表
    2. 修整整齊
    3. 插入圖表