Ina數位典藏經驗與應用

 公視於201962021日舉辦「Ina-PTS工作坊」,以解放數位片庫:傳統電視影音資產的再思考與再利用」做為主題,邀請法國國家視聽研究Ina(l'Institut national de l'audiovisuel)三位專家Anne Couteux、Xavier Lemarchand、Frédéric Chéron前來公視分享「如何利用片庫資源說一個好故事」(Setting up a Digital Contents Strategy: Case Study of Ina’s Digital Contents Strategy,以及片庫管理與線上檔案存取經驗」(Managing digital video archive, improving online archive retrievalIna-PTS工作坊吸引了不少台灣業者與會,會場上的提問更是踴躍。

Ina1975年成立的法國國家公共媒體,成立使命包括1.影音內容典藏(Audiovisual archiving);2.影音內容產製(Production of audiovisual content);3.影音和數位研發(Research in the audiovisual and digital fields);4.教育和技職訓練(Educational & vocational training)。

Ina年度預算1.3億歐元(新台幣46億元左右),三分之二是政府捐贈(新台幣30.6億元左右),三分之一是商業自籌(新台幣15.3億元左右),目前員工人數951人。

 Ina成立的核心概念就是採集、保存、推廣與傳播法國的國家影響力,透過影音數位典藏,傳播法國國家記憶。業務跨及影音素材、專業諮詢、節目製作等專業領域。Ina的媒體特色是影音素材垂直整合,不只是採集、管理、分享數位影音檔案,而且持續推出新節目,Ina是全世界特殊和少有的公共媒體模式。

Ina影音典法律依據1986的「通訊傳播法」(Communication Act),收錄典藏和商業使用法國公共廣電200萬小時影音內容。另一個法律依據是1992的「影音典藏法」(Audiovisual Legal Deposit),收錄法國168個廣電頻道節目內容,每年收錄100小時數,目前已收錄1,800萬小時內容(收錄典藏每日播出畫面)。2006年起進一步增加典藏14,000個網站、12,600個推特帳號和其他線上影音平台內容,Ina透過五十個實體圖書館提供閱覽,主要做為學術目的使用。

Ina持續儲存所有可以掌握到的法國影音資料,以及版權販售200萬小時的公共廣電影音。Ina使命不只是儲存法國公共廣電節目,也包括地方廣電、民營廣電、海外播放的影音內容也都會加以儲存,Ina全天候蒐集和數位化168家廣電頻道的影音內容,不是為了商業用途,目的是要建立法國的國家影音片庫,儲存法國當代影音檔案。希望用數位影音保存法國文化,建構法國的歷史共同記憶,國民共感經驗分享一個世代,同時提供全球使用者應用法國保存的影音媒材。

 以下依片庫典藏、片庫建檔、片庫應用三個角度說明Ina近半世紀以來的片庫使用經驗。

 

片庫典

Ina2000年開始進行龐大的磁數位化轉檔工程,著手將2吋、1吋、3/4吋、1/2beta進行轉檔,過程中也面臨到磁受損和傳統播放器不足困境,由於缺少播放器零件和傳統工程人員,Ina仍有超過一萬卷磁尚待處理。磁轉檔必須有以下的思考方向,首先是數位化的優先排序(新聞資料、教育內容會優先進行數位化,因為有比較大的調閱需求),其次是評估磁狀況(發霉和顆粒化的受損程度,相關儲存狀態),第三是數位化後的應用考量(線上使用宣傳目的、永久儲存),不同用途會有不同的數位化做法,第四是列出不同格式所需的磁讀取設備,第五是儲存容量大小和管理架構,最後是評估每月的數位化產出時數。

 Ina2016年參與了法國公視新聞台franceinfo內容產製,每天產出三支片庫影音新聞,播出方式包括電視、網站和社群媒體。這些內容具有以下影響包括提供不同視角的新聞,縮短片庫產製流程,以及更多的編輯和情境化格式。

Ina要求所有的影音內容,只要能夠找到的都要加以保存和加快數位化進度,保存方式秉持「3-2-1原則」,影音內容均建立3副本,2數位副本存放在兩個數位中心,另外會有1儲存在數位Betacam,保存超過130公里長的磁帶資料,地點在遠離巴黎市中心的片庫。Ina不會將影音內容存放在外面的雲端資料庫,因為歐洲並沒有像亞馬遜這樣的雲端供應商,對Ina而言是會存在高度風險。

Ina片庫數位化是一個浩大工程,必須思考是要存放在IT設備?或是小型磁帶櫃?或是光學驅動機上?Ina思考利弊得失後,決定不考慮光學驅動機,因為十年後將會面臨讀取問題。這些就會涉及類比儲存數位磁帶、數位檔案三個部分,因此必須思考儲存技術、播放器零件、工程師專業知識、影音編解碼設備等。Ina2000年之前仍有50萬卷類比帶,當時還沒有磁帶數位化方案,那個時候仍然是未壓縮檔案,而且技術昂貴,將類比轉到索尼和富士的數位Betacam在當時仍然是很新的技術,這個過程整整走了十年。2012年起再將所有的數位Betacam轉到數位片庫。但是最後一哩路總是最辛苦的,Ina如今還5%轉檔工程,預計要再投入五年時間。Ina目前仍然使用H.264編解碼格式而不是使用H.265,主要是評估H.26516種授權費用過於昂貴,Ina現在仍在等待H.266技術,因為H.266具備優良的CPUGPU處理能力也沒有昂貴授權費同時比較容易取得

 Ina在每一代的轉檔典過程,都會以人工和自動化方式檢核數位化資料,例如1就是由工程師和技術人員以人工方式檢核Ina現在每周轉檔一千卷數位Betacam則是透過系統品管同時每年也會進行十萬卷的數位Betacam檢核,這些都是由Ina技師負責

 

片庫建檔

 當編目與建檔部門取得技術部門的檔案後,隨即進入後設資料製作階段。Ina編目與建檔分屬兩個部門,編目內容由頻道業者提供,自動輸入Ina資料庫,不需要人工重新一筆一筆輸入,編目人員則會依據Ina編目標準和系統內建的搜尋引擎,進行檢核、更正、對、一致化作業,以及補充相關資料,鍵入節目大意和關鍵字,修改成符合Ina標準的檢索檔案,Ina有很完整的內建參考介面和辭典資料庫,會依據字清單進行字控管,避免字模糊,影響搜索結果。Ina編目內容包括頻道、節目類型語言、日期、標題、演職員表、製作人員、播出時段,以及建立相關資料和文件連結。編目人員必須具備檔案管理音管理、SQL程式語言、word、excel等能力,同時了解節目製播流程。

 接著進入建檔階段,文獻建檔人員必須先看過影片,根據內建的分段和註解工具,建立文本註釋,清楚描述影片內容後設資料,細分關鍵字和描述文字索引,這些程序都關係到未來片庫檢索的方便與否,只有完整的建檔內容,才能滿足不同使用目的檢索需求,也才能提供快速正確、完整的搜尋結果。

Ina文獻建檔人員另外一項重點工作是建立主題語料庫,規劃、整理和剪輯影音片段,同時與使用者溝通讓使用者可以依據主題內容快速順利的調閱到檔案,滿足記者研究人員等不同領域的使用者需求。文獻建檔人員建立主題語料庫過程中,會利用次要主題建立分類資料夾,以顏色標記各種不同參考媒材,工作雖然耗時但是有利於使用者快速取得片庫影片。文獻建檔人員首先會根據使用者需求進行先後排序,接著依照節目類型調出影片進行剪輯,接著詳細進行紀實建檔和註釋索引,同時建立主題式樹狀結構。

 文獻建檔人員也要參與出版規劃,定期策展,撰寫與結合片庫內容,建立註解和索引關建字,以利線上出版檔案調閱。Ina多數文獻建檔人員都是碩士學歷,這些人必須具備紀實語言寫作能力,以及片庫管理檔案管理、影音管理知識,Ina也會提供建檔人員寫作訓練,因為片庫後設資料建檔與網路線上出版的寫作方式是有很大的差異。

 Ina片庫裡具重要性的節目關鍵片段也會個別建檔、編目和詳細描述,因此Ina片庫裡有相當多的另外擷取的影音片段,這將有利於使用者快速調閱檔案,同時Ina編目建檔也必須為使用者記者、導演、製作人等等)的未來需求預做準備,建立不同層級的描述資料(例如紀錄片中的關鍵字綜合概述、依影片時間序撰寫的大致內容詳細描述等等卡通編目建檔則相對簡單許多)透過編目建檔的精準辨識除有利於檔案快速搜尋,也可加快各類型內容即時上傳到各個平台上的使用速度。

 以製作一個一小時節目內容為例,製作人從片庫拿到二小時以上的影音素材,或是更多素材時,傳統片庫使用者是從頭看到尾,建立時間碼,做好分段場記之後才會進入使用階段,Ina文獻建檔人員必須具有影片分段處理能力,剪輯影片,選取所要畫面加入各段起迄時間碼和詳細描述,使用者即可以根據Ina系統分頁標籤,找到和選取出分段影片內容,而不必從頭到尾看完所有影片之後才著手製作,這將有利於節目使用者爭取製作時效。

 Ina目前正著手建置Data Lake大系統,整合兩個分立系統,建立Notilus人工智慧編目建檔新介面,藉由辭典輔助可以將影音對話直接轉成字幕和詳細文檔Data Lake大系統的目的是為了加快片庫影音搜尋速度同時Ina也正在研發影片和音檔分析工具,偵測辨識人臉人聲、影片物件等,Ina也藉此同步開發片庫新產品,例如利用機器學習產生自動分類技術,未來將不再需要人工編目和歸檔工作,AI就可以完成。Ina也在研發OCR光學文件辨識系統將影像文檔轉成純文字檔,透過Ina辭典比對後輸入Ina內建資料庫,這些新技術將有助於使用者的片庫搜尋和擴大應用範圍。

 

片庫應用

 傳統片庫的使用方式正在顛覆,片庫已不再是靜態儲存,而是動態應用,片庫成為線性和非線性原生內容產製媒體之一,這在過去是難以想像如今Ina片庫可以將節目內容直接觸達到使用者,多元應用持續擴張使用範圍,以及提供公眾近用服務,以下臚列Ina的服務使用內容:

  • 學術使用:Ina建立了社會科學學術片庫,法國學者、研究人員、學生可以利用分布在法國全國的五十座圖書館使用所典藏的1,800萬小時影音內容,內容可做為多元學術使用,例如法庭審判案例研究、媒體民族誌長期分析、AI量化調查研究等等。
  • 公眾使用:Ina在2006年所建置的Ina.fr平台提供法國公民免費近用,影音內容以新聞和時事節目為主,75%影片,25%音檔,共有4.5萬小時內容,每個月有400萬不重覆造訪者。Ina Premium平台提供月費2.99歐元(約新台幣105元左右)訂閱隨選,其中包括影集、電影、紀錄片、表演藝術、音樂會等等。
  • 教育使用:Ina Jalons平台是和法國教育部合作,邀請法國教育工作者一起設計片庫教育內容,免費提供法國80萬教師和1,200萬學生使用,片庫內容最遠可溯及1850年代的紀錄片,以及從1914年到今天的電影新聞短片、廣播電視影音內容等。教師可以下載Ina影片在課堂播放,同時利用Ina片庫設計課程。
  • 商業使用:Ina MediaPro平台提供全球使用者版權內容,使用者可以透過線上訂閱搜尋200萬小時影音內容和120萬張照片,目前全球有12,000訂戶。Ina也會為企業量身訂作影音內容,例如Ina為法國國鐵80周年製作影音網站,使用100支片庫影片為法國國鐵設計以時間軸為主題的網站,以及20支短片所組成的合輯,賺取營收。片庫商業使用上也包括坎城影展、滑雪場、在地主題等等。
  • 社群使用:Ina自2012年起在YouTube上建立36個主題頻道,目前頻道上有6萬支影片,累計100萬訂閱人次,每月有1,600萬觀看次數(68%是在地法國人,20%是法語系國家使用者,例如比利時、加拿大、瑞士等,12%是其他國家),最受歡迎的Ina頻道是脫口秀、歌曲、社會。Ina在臉書上也有160萬追蹤人數,男女比例51%:49%,2018年累計有2.72億的影片觀看數(較2017年成長9%),Ina影片經常在社群上被廣泛瘋傳。Ina在推特上則有15.3萬訂閱數,使用者以記者和媒體為主,每天貼文6-10篇,2018年總計有1,700萬影片觀看數,較2017年增加155%觀看數。IG上有23萬訂閱數,55%的使用者年齡在34歲以下,男女比例43%:57%,平均一天貼文二篇。
  • 其他使用:Ina與法國文化部合作建置表演藝術網站,選出920部自1940年代至今的舞蹈、戲劇、歌劇等的表演藝術影片。Ina每年也會製作60支以片庫為核心的紀錄片,透過不同觀點呈現片庫影片,重製時會找出有趣觀點。同時Ina影片也會應用在電影、影集上,Ina也會在網路上推出紀實影集,每集五分鐘,總共24集,解釋重要的歷史事件(例如:廣島原爆、古巴飛彈危機、環法自行車賽等),另外每天提供法國公視新聞台franceinfo三支各2.3分鐘的片庫新聞和時事影音。

 

 公視董事長陳郁秀2018年二月前往法國搭起Ina和公視合作基礎,她在工作坊致詞時特別指出,2018年前往Ina工作現場看見法國導演帶著學生進入片庫檢索資料進行影片再利用,Ina人員當時指出這是常態工作,目的是讓專業人士在學習階段就能運用國家資產,過去重要的影音資料再利用,為新的世代講新的故事,產生不一樣的價值。她因此表示,公共電視是台灣的良心,也是台灣的圖書館,保存台灣20年來重要的新聞、節目等影視資這次的工作坊除了學習Ina經驗希望能夠藉此形成國家政策,也是值得公視未來努力的目標。