衛福部癌症資料庫開放專案

緣起

想要了解全台各鄉鎮罹癌的狀況與分佈, 不過政府資料並不容易使用 (cris.hpa.gov.tw 以5~7個步驟才能索取單個鄉鎮的歷年資料), 萌生了爬取所有資料的念頭. 日前已有其他的嘗試, 例如 http://github.com/hcchien/doh-cancer 使用 phantomjs 爬取, http://github.com/g0v/cancer/ 存有全民健保癌症相關統計資料, (其中就診人數值得深入探討)

5/10 CCSP Hackathon team goog1er (from g0v) 決定來把資料爬到 github 上順便視覺化, 因此此專案便加速進行了.

Crawler repo: https://github.com/yhsiang/cris-cancer

資料欄位說明

分率=某特定癌症數÷總癌症數×100

粗率=(某特定癌症新診斷或死亡人數÷總人口數)×100000

年齡別率=(某年齡層癌症新診斷或死亡人數÷某年齡層人口數)×100000

標準化率=Σ(某特定年齡別率×該年齡層標準人口數)÷Σ(某特定年齡層標準人口數)×100000

資料抓取參數

[資料類型]   指標-發生率

[統計值]       年齡別率

[性別]           男性及女性

[年齡]           全部

[鄉鎮]           各鄉鎮區 

[癌症部位]  全部

視覺化網址

http://g0v.github.io/cancer/viz/

問題回報

資料及視覺化等若有問題或建議請留在這邊