2016-02-01 桃園市政府開放資料論壇紀錄

時間:2016年2月1日

地點:桃園市政府

錄音:https://soundcloud.com/audrey-tang/opendata-x-opentaoyuan

簡報

*

http://www.slideshare.net/autang/ss-57696323

        這其實是我前天在法國的簡報,因為他們外交部邀請我,在全球氣候變遷會議之後,去給他們一些指導,要如何做電子化政府及開放資料活動,所以我介紹了台南的案例,因為當時還不知道有桃園的案例,不然可以一併介紹(笑)。

        跟我對談的這一位就是 Blaise,他在Google的工作,剛才二、三位老師都有提到的。他本來是在微軟負責做微軟全部的地圖架構師,後來他跳槽到Google,所以Google現在計算各位的行動資料,就是這個傢伙做的(笑)。

        我跟他有一些滿有趣的對話,這就是前天的簡報,大概翻成中文,當然因為時間的關係,可能會需要跳著播,但還是想跟大家分享一下。

        這個題目是「明日之後的世界」,主要講的就是說我們透過開放資料、透過網際網路、透過群眾參與,我們如何讓這個地球的狀況變得更好。

        這是一個影片,這在講的就是從太空人的角度看起來地球是很小的,我們之間都是互相相連在一起的,當然並不是每一個人都能夠成為太空人、有這種「綜觀效應」,但是很多人上了太空再回來之後,他們都變成一個比較好的人,就是比較關注這個世界,從太空看不到國家的邊界,都會願意跟全球合作;好在現在有一個虛擬實境的技術,剛剛也有請幾位老師戴上去,就真的可以像太空人一樣可以看到地球。

        在網際網路發明之前,我們所有人都只能夠跟我們的城市、旁邊的鄰居等人來作資料的交換及資訊的交換。但尤其是當Web在二十幾年前被發明之後,它其實也有一點像國際太空站的位置,我們透過資料能夠跟全世界的人互相協作,一起做出更有價值的運用。

        我到法國作這個演講的前一天,法國國會才剛通過一個很重要的法案,他們叫做「數位共和國法案」,Whisky說他覺得非常有意思,所以要講三遍。這是一個很好玩的法案,這個法案就像數位基本法,他們的想法是這樣子的,雖然在網際網路上是沒有國界的,但是當我們到網際網路看整個地球的時候,我們內心還是可以保有一些作為人類的價值。

        這些是法國立國的價值,放在網路上就是:我們應該要容許任何人從網路上自由聯絡到其他人,不管是公部門或者是私部門。我們公部門或私部門提出來的資料應該要讓各種不同的人使用,不管是有某方面的障礙或者是特殊的需求。最後當然就是這個東西要能夠促進互信,要保證沒有被攔截、監聽的一個安全狀況。

        更重要的是,他們在制定數位基本法時,每一條都預先po到網路上,花了二個多月、三個月的時間讓大家逐條審查,裡面的哪一條哪一條網民的感覺為何、哪一些不同意及他們可以提出新的條文;其中一條就是提出新的條文且被他們的國會所採納的。從現在算起來六個月之後,他們的行政機關提出一份報告,告訴他們的國會說以前只有上議院跟下議院,現在多一個「網路議院」,所有行政院的東西要送進國會以前,都要先放到網路上,用這樣的程序來討論,討論完之後國會再來討論,所以人民變成真正眾議院的概念。

        這樣的概念其實後面就是Open Data,如果不是Open Data的話,人民的討論事實上是沒有什麼價值的,只有當人民手上的資料跟立委手上的資料,或是跟議會手上資料是一樣的時候,他們才能做出對議員有意義的貢獻。

        這個東西跟一年之前我在臺灣有負責主持這樣子的計畫叫做vTaiwan,我們也是同樣在網路上審議跟法國數位基本法差不多的這一些題目,很感謝各部會的參加。更重要的是,我們也討論一些全球性的問題,如Uber及Airbnb。

        這同樣是我剛到法國時,就是我演講的前一天,所以是「昨天之前的世界」。我不知道各位有沒有看到:計程車司機不斷癱瘓交通,而且去衝撞公路安全島,鎮暴警察就出動了,還用催淚瓦斯、放火燒車,各位可以想像到的都有;而且這個東西不是只有這一次,我去年去法國的時候,他們也完全有一樣的示威,Uber這件事情,因為影響到計程車司機的生計,已經連續抗議大概一年多的時間,這個的原因是因為他們沒有一個有效的辦法,去信任公部門真的能夠保護人民的利益。

        這個是我製作的圖表,在以前我們做決策的時候,公部門是設立一個議題,比如像都市更新計畫等,私部門的「P」這些產業本身就有一個產業鏈,所以他們就會派人遊說,來參與政策制定。但問題是外面這些包圍的計程車司機們,他們認為進去一、二個委員其實不能代表公民社會充分的問題,在這樣討論完之後,公民社會的人可能還會切割這一些委員說「我們的聲音其實沒有被帶進去」,所以公部門、私部門及公民社會三方都會互相不信任,而這個重點就是因為大家手上的資訊是不一樣的。

        這裡要講的是,在政治上有一個講法是「Where you stand depends on where you sit」,就是如果每個人坐在自己的駕駛座上、自己的地方,本來就只會爭執自己的利益。網際網路的重點就是我們要想辦法建立出一個方法,讓大家能夠將心比心在去看到,其他人在同樣一個有爭點的案子時,其他人的角度是怎麼看的。
所以,不管是法國所做的線上審議空間或者我們在臺灣做的Join平台或vTaiwan平台,後面的想法都是說:以前只有政府跟單獨的企業閉門協商,現在我們有一個公開的協商方式,大家還是喬事情,但喬事情的過程在網路上是透明的,而且公民社會現在也有參與空間。因為時間上的關係,這邊稍微帶過。

        在COP21的時候,全世界有一百零四個國家,同時對於全球暖化氣候變遷的這件事做了一場審議,在每一個城市有一百個人,在法國因為有十四區,每區有一個審議;但在臺灣只有一個,但事實上是在三個城市同時發生,也就是台北市、台中市及台南市政府都有一百個人的大廳,在左右兩邊的牆都裝了超大的螢幕,往左看是一百個人、往右看也是一百個人,大家就是站在一起,對於用同樣的音樂跳舞之類的(笑)。就是說有一個很虛擬的公民審議,大概三百人的空間。

        而這個空間有一個特性,市民自己提出來的議題能夠被納入都市計畫裡面,所以賴清德市長說現在剛好有一個非常有爭議的案子是「飛雁新村案」,為保護樹木、文資等有各種不同喬不好的狀況,不如就用這種方式來審議,所以他們已經開了十一次的會議,每一次的紀錄都用開放資料的方式放在這個平台上,讓大家知道其實市府沒有徇私,市府是很衡平考量大家的想法。

        為什麼可以做到這一件事?因為他們使用專業的中介者,有審議專業的人在政府決策資料還在搜集時就先跟民間社會的私部門分享,這時當民間、私部門覺得說,也可以來告訴政府說其實有一些東西沒有考慮到的時候,他們才會覺得討論是有意義的,不然就直接去放火燒車了。

        這個就是臺灣在討論Uber的經驗,這是我們跟維基百科社群做的一張圖,紅色的部分是非法的部分、綠色的部分是合法的部分,臺灣跟法國都是粉紅色,表示比較貴的是合法的、便宜的是非法的(笑),這是Uber現在的狀況。

        臺灣Uber密度最高的地方就在桃園,機場出來一按Uber,一看就是二十輛密密麻麻的Uber。
我們在做臺灣Uber審議的時候,我們只討論自用車載客,已經合法那個是不用談,我們也不討論共享經濟這種很大的東西,但我們要談的是大家對於這一件事有什麼感覺、什麼想法,這一些想法我們把它變成開放資料,讓大家分析對Uber的看法。我們承諾會找所有的相關部會,財政部、經濟部、交通部、Uber、臺灣大車隊、台北市計程車公會所有這些人坐下來當面討論,而討論的議程是由群眾透過網路去決定的、透過開放資料的分析所決定的。

        我們界面就是這樣子,大家可以在手機上可以看到別人的意見,可以看到贊成或反對,按了之後,位置就在底下開始移動。這有二個好處,一個是可以看到朋友們是在不同的陣營,只是平常聊天不會聊到這一個,但不管是挺Uber或者是反Uber的或別的意見都有,不是敵人,而是朋友有這樣的意見。

        另外,大家的看法是可以移動的,隨著時間過去,我們進行了三個禮拜,大家提出一些妥協、有一些互相承諾能夠重疊的看法,慢慢會收歛成真正的共識,也就是所有人都可以同意的東西,公部門扮演什麼角色?我們跟交通部、經濟部、財政部分別問說你們能夠怎麼回應,我們跟臺灣大車隊、Uber及台北市公會問「你們想要聽到什麼」,最後會問大家「你們有沒有搭乘的經驗」、「有沒有職業駕駛執照」等等問題,我們結合這九個問卷的問題,大概就可以知道參與的人的看法,然後每一個人再提出感受跟意見讓其他人投票。我們蒐集出真正六個共識之後,我們就進行利益關係人對話,讓所有人都坐在這邊問「對於所有人形成這個共識,你們能夠做出什麼承諾」。

        (播放影片)


        這個在show的時候,一直不斷跑法文字幕出來,那也是 Whisky 幫忙翻譯的(笑)。

        這個東西事實上是滿有意義的,在整個歐洲Uber都是問題,他們如果要做跨城市Uber審議,未來就可以使用這樣的模式來討論這一件事。

        我要講的是:開放資料其實就是建立互信的骨幹,如果開放資料只是從公部門流向私部門,或者是流向私部門再加上一點點公民社會的話,大家都還是會一直質疑,不管是個資的問題或者準確性的問題或者手動key或者是從資料庫自動產生的問題,所有的這些東西還是會不斷地被外界要求。


        只有當他能夠成為,對於每一項開放資料,大家都可以繞著這個資料去進行真正的討論,以及當民間、公民社會有一個審議的場域,說我們想要看到更多的資料,按下去不是跑到市長信箱,而是真正可以取得都計、環諮、環評所有這一些會議紀錄。
不是委員名單而已,而是能夠完整放到網路上面的時候,大家才能對於互信有進一步的進程。

        也就是說,中間這條線勢必是雙向的連結,如果你的下載是10m,但上傳只有2k,長此以往,大家就會覺得這只不過是政府做政令宣導的另外一個方式而已,我們在國際的經驗,這樣的方法很難撐超過五年,因為是不斷耗損公務員的心力。

        因為時間的關係,我直接跳過這一張,直接最後一張簡報。

        我們希望最後要達到的是「注意力的對稱」,這個是法國哲學家拉岡的想法,從他的想法我們可以想到公部門、私部門及民間社會,這三個環扣是彼此相連的,如果二個中間沒有溝通、如果有任何一個環扣是斷裂的,另外二個也會一起斷裂,因為事實上我們都是同樣在同一個社會裡面,這三個部門只是表示我們跟別人溝通、跟別人交換的三種模式而已。

        如果我們不能很自由在這三個模式中間,交換決策資料的話,這三個部門之間就沒有溝通,沒有溝通當然就沒有互信。我想因為時間的關係先講到這邊,謝謝。

座談

        我想同樣也是對於四大主題,完全同意老師的見解,我就不重複。

        第一個是如何瞭解開放資料的效益,我自己的經驗是,每次都是類似剛剛講的,計程車司機開始撞公路、燒車的時候,開放資料就會最有效益。我自己的經驗,不曉得大家是否記得去年國教院課綱的審議?大家有過一些爭執,這是講得比較輕微的了,然後教育部也被占領等等。
在當時我是去加入課發會,等於跳進正在發爐的東西裡面去當委員,但我只做了一件事,就是我要求所有課發會委員所講的每一個字都用逐字稿的方式,用開放資料的方式讓人能夠連結到他在哪一場會議、講了哪一句話、是對誰講的。

        這樣子有什麼效果?有一個效果就是說,來與會的本來都是吵得非常兇的人,突然之間就變得比較文明了,因為他們知道說有上千個人在開放資料平台正在看他們講的話,這是一件事;但另外一件事是,外面的公民社會就比較不會覺得說,他們要一再地去拉白布條陳情,他們就會看到說,好比之前性平不是吵得很兇嗎?他們就會看到說所有訴求,我們在會議裡面真的就已經討論,而且已經做出決議了。下次再拉白布條,至少字就可以換一下,不用再吵上次那一個題目。

        當然我知道桃園有一些比較敏感的議題,像做預備聽證的航空城等等,但所有的這些東西,其實目前在開放資料平台上面,只看得到航空城產業聯盟會員廠商的列表。除此之外,我相信在航空城的整個過程裡,有非常非常多資料是可以開放的。如果你放上去的話,可以大幅減低公民社會的一個疑慮,這是第一件事。

        另外一個是資料開放的方向,我一直要強調公開與開放的不同,我剛剛所講的這一些其實都是依據政府資訊公開法,也就是說其實並不一定需要讓大家能夠加值或者是改作,只要po上去,也有一樣的效果啊!


        但問題是說,幾乎沒有人有那個時間去看五百頁的PDF。相信各位的工作都是看五百頁的PDF,但各位是專家,並不是大家都有這樣子的能力。如果你把資料授權開放出來的話,民間有很多賢人——太閒的人,他們會花很多的時間去做懶人包,去看完這五百頁的PDF之後,做成一分鐘就瞭解的動畫,或五分鐘就可以瞭解的小遊戲。這些太閒的人才是我們開放資料真正的目的,因為這樣的話,大家在溝通之前就可以事先知道說我們在討論哪些事情,就不用每個人都去看五百頁的PDF,然後那些沒有看的人或沒有事先看的人就會罵政府,因為根本不知道你在做什麼,這是第二個。

        第三個,如何要更方便找到資料、加以運用?我覺得最重要就是說把它放到各位各局處的首頁、各局處的粉絲團,甚至是各局處的公車站牌,任何地方只要是這個開放資料所加值用出來的成果,像在巴黎市我們在做審議式預算,公民自己提案的時候,我們做出來的每一個橋、每一個路燈,只要是市民提議做出來的,後面有一個資料集,就會有一個代碼、上面壓一個浮水印,大家就知道這個是公民提案出來。或者是QR掃一下,你就知道這個東西後面的那個資料是哪裡來的,那這個對於在地的認同感非常非常有幫助:比如我根本不是法國人,可是我參加過他們的參與式預算二次之後,我就覺得有一種是巴黎人的感覺。

        最後,如何讓加值業者的成果回歸到平台?我覺得這個最重要的是,如果能夠鼓勵加值業者不只是使用桃園資料,而是去混搭所有其他的資料集,以及其他城市、別的資料時,就會讓公務單位不但在各局處之間,也在跟別的城市局處之間討論時,大家可以看著相同的資料來討論。
我覺得這個是最適合把公務預算撥出去的,這讓我們在跨城市或跨國家在做政策討論時,可以看到相同的格式、相同方式的資訊來討論,以上大概四個建議,謝謝。

問答

        這部分國家CNS標準也就是關於個資去識別化部分,剛好是vTaiwan其中一個案子,同樣我們這個月底也會做一個比較大的諮詢會議,所以我就目前標檢局及從其他地方來的,花二分鐘簡單跟大家報告一下。

        剛剛確實如老師所說的,那叫做「Enclave」,就是把研究者關在一個地方,USB都不能帶,這樣子當然沒有問題,這個是我們之前做研究都是這樣做的;但是另外一個問題是說,我們要怎麼樣尤其是個資法現在新修正、現在醫療資料特種個資可能在今年年中就要開始施行的情況下,是不是我們資料集裡面只要提到任何關於健康的東西,我們就完全一個字都不能寫呢?這是很多全國同仁在思考的一個問題。

        在CNS標準裡面其實有這樣子的標準,它叫做「個資去識別化」,這個去識別化的標準,之前在沒有標準時,有些機關自己去做了一些不太好的狀況,其實像剛剛講的健保資料庫被告就是最不好的情況。因為它雖然把看起來名字都拿掉,但留你的出生年月日、就診地點及日期,在這個地方、這個時候去的出生年月日就那個人不然是誰?所以透過間接識別的方式,只要還找得到,那真的是違法的,所以其實現在還在告,並不是真的判成合法。

        所以,我們現在在推動的一個方式是,有一個程序是把資料餵進去之後,可以保證對於其中的每一個人的隱私洩漏都是極少的,也就是出來的一萬筆資料裡面,可能對於每一個不同的出生年、出生月及出生日的地理資訊,好比至少二十二個人都完全一樣的,所以猜中那一個人的機率就只剩下二十二分之一,這可以調控,調到五十分之一、一百分之一都可以。

  這個所謂「匿名化的過程」現在已經有一個國家標準,所以我覺得之後的開放資料一定都要先透過這個標準才可以出去,不能像之前的ETC,公路局覺得車牌號碼拿掉就好了,可是事實上凌晨一點到二點公路上,如果真的就只有這一台車,那你還是知道那一台車,所以這個標準的建置是非常重要的。

        我再說一句話,不好意思。

        剛剛有其中一小部分問題:如果資料出來被分析,如果分析本身是有誤的、有偏見的、有差誤的,要怎麼處理?
其實在資料的授權管控裡面,我們當初本來可以做一個決定,像是在巴黎市,他們的決定是要做加值運用的時候,加值運用的演算法本身也必須公開,才能使用開放資料。這是一個科學精神,也就是你重現結果的方式要讓所有人看。

        臺灣走了一條不同的路,運用的人可以選擇公開、也可以選擇不公開,不公開之後就做出隨便什麼結論,這個當然對於大企業是比較有幫助的。
但因為這樣的關係,我覺得在公部門的人,不管是你們以後辦黑客松也好、辦加值運用的合作也好,我覺得比較是鼓勵開源、開放的方式,去把加值運用或者是分析的方式給開放的競賽者。

        我們的授權模式已經做了,這個短時間可能沒有辦法改,但至少我們在文化上,可以鼓勵去做分析或跟加值的人,也把他們做的方式公開,這樣子大家才能看得到偏見、糾正偏見,大概是這樣。