中研院「社會變遷全記錄」半自動化計畫

專案簡介

緣由

中研院台灣社會變遷全紀錄,記載各大主題及面向的社會變遷,主要內容來自社會變遷調查 (自 1985 年起),以及其他各種政府統計。

但是因為全記錄涵蓋的面向廣、更新不易,希望能建立一個簡便的機制,連結各個議題所使用的「調查問卷題號」與「政府統計」,讓每個議題可以自動化更新所連結的相關數字,並且鼓勵關心不同面向的社群,就這些基礎資料來進行研究或書寫。

推廣使用方面,希望提供三種層次的資料,讓有興趣的人,可以逐步理解如何使用調查資料:

  1. 第一步是讓有興趣的人,可以先快速瀏覽資料,不用 excel 或太多資料處理,就能˙進行簡單分析,以了解資料特性。例如列出歷年快不快樂指數在性別上的差異。
  2. 第二步是如果覺得資料有趣,那可以開始看一些既有的資料整理,此部份可參見台灣社會變遷全記錄i
  3. 第三步則是拿逐年的原始資料來使用,需要建立起撿變得機制,連結跨年份不同問卷的題目。

要解決的問題

說明問題的 [ PPT] ( https://goo.gl/WRELny )

  1. 第一步:建立可供人簡易查詢的界面
  2. 第三步:半自動化連結跨年份的不同問卷 + 連結主計處
    1. http://www.ios.sinica.edu.tw/sc/cht/5.php 每期的問卷的題號不同,需要有「題目」對應「各期題號」的 master table
    2. 「題目」對應已有相關研究與論文(社會所有資料,待整理)
    3. 自動抓取主計總處列管統計
  • 舉例來說:
    1. 婆媳關係研究,

    使用統計資料:

    希望有一個工具,每次有新的問卷資料或者統計資料,就能自動更新這篇文章的圖表。

    資料下載位置:

    資料特性

    預定使用者

    給想要了解台灣社會狀況,願意拿資料來作初步分析的人

    預定功能

    1. 可以透過簡單的操作,針對整理過的統計資料,產生兩個變量(或再加上時間)的圖表。
    2. #needpeople 需要有人協助半自動化~

    現有類似專案

    (現成的是否可以直接使用?或者有什麼不足之處?國外專案可參考?)

    相關專案

    (衍生自某專案/衍生出某專案/API串接自某專案.)

    台灣發展經驗實證資料庫 有更多其他

    https://www.most.gov.tw/hum/ch/list?menu_id=27c85f1c-c983-4f2f-8191-7183a1ac6778

    中研院調查研究專題研究中心有提供線上分析,但是一樣未串接跨期的資料,需要手動選用;且需註冊

    http://140.109.171.222/webview/index.jsp?object=http://140.109.171.222:80/obj/fStudy/C00221_1

    貧富差距 https://g0v.hackpad.com/Ko9q8O2Y1rr

    世銀統計與我國統計對照 (ronnywang 有一次提的, 連結待補)

    授權方式

    Code: MIT

    Document: CC-BY

    使用資料

    中研院社會變遷調查原始資料 - 目前為學術用,正與計畫主持人溝通轉為開放授權

    專案目前狀態

    規劃

    利益揭露

    提供 use case 的的中研院社會所研究員與其研究領域相關,

    徵求協作者

    發起人/拋磚人:

    實作細節(非技術背景可跳填)

    協作工具

    進度與 to-do

    成果展示(規劃文件、雛形/草稿、原型/初稿、正式發佈/完稿)

    如果有做出成果可以往這邊丟丟看

    不同年齡對於離婚是否有錯看法(1=非常錯;  2=相當錯;  3=有點錯;  4=沒有錯)

    不同調查年份對於離婚是否有錯看法變化(1=非常錯;  2=相當錯;  3=有點錯;  4=沒有錯)

    用 Grafana + InfluxDB 來作簡易版視覺化工具

    http://140.109.240.72/dashboard/db/po-xi-chao-jia-20-nian-bian-hua-tu

    所有欄位同時是 field 也是 tag ,所以可以同時使用,匿名可編輯不可存檔。

    婆媳吵架 20 年變化:

    編輯界面:

    1. 先點 FROM,選 basic_88
    2. 再點 SELECT ,選擇想要的欄位
    3. 再點 GROUP BY 的 + 號,選想要的第二象限