DocuSky
BETA
此工具可用來管理 XML 建庫檔的 metadata 欄位,並且可設定欄位的顯示標題
首頁
|
我的資料庫
簡要說明:
此工具可讀入一份 DocuXml 檔,讓使用者指定要將哪些 metadata 欄位的值複製到其他欄位,然後輸出另一份 DocuXml 檔。
步驟1. 讀入 DocuXml 檔案:
選擇檔案:
▶ 選擇 Corpus(文獻集) :
* 如只有一個Corpus,則不用特地選擇
* 更換Corpus,會儲存當前更動內容
▶ TABLE #1: 已載入的 metadata
[檔案名]:
*****
[文獻集]:
*****
[註]: 如果有例外標籤 會以此顏色標記
編號
文獻集 metadata 欄位
該欄位的一般用途
將左側欄位的值,複製到另一個欄位
▶ 是否要更新 corpus 欄位內容,將所有的文件都放在單一文獻集之下?
是
文獻集名稱:
[註]:
會把多份文件corpus setting合併。若tag或後分類重複,則以第一份文件之設定為主
▶ 對檔名子字串進行取代(若以下所指定的兩字串相同,則不進行取代):
將檔名字串的:
取代為:
▶ TABLE #2: 可指定 Metadata 後分類的標籤顯示名稱(若有多項相同性質的標籤,後分類顯示時,預設只會顯示一項):
[註]: 如果有例外標籤 會以此顏色標記
編號
metadata 標籤
可用於後分類
該標籤預設的後分類標題
自訂的後分類顯示標題
後分類顯示順序
是否顯示後分類
▶ TABLE #3: Tag Analysis: 可指定自定義標籤是否加入 tag 後分類、該標籤的顯示名稱、也可將文件中第一個該標籤內容拷貝到 metadata 欄位:
* 拷貝到 metadata 欄位時,若文件找不到標籤值:
設為預設值 '-'
沿用上一篇文件的標籤值
編號
標籤
後分類
點擊可全選
類別/子類別
自訂的顯示標題
標籤內容 → 詮釋資料欄位
按我套用以上規則更新 DocuXml(同步更新本頁顯示內容)
步驟2. 輸出 DocuXml 檔案:
progress:
欲儲存的建庫檔名:
點我儲存
本工具可額外匯出以下表格型資料:
▶ 匯出 metadata 到 .csv 檔:
匯出 metadata
▶
匯出 tags 到 .csv 檔:
匯出 tags
▶ 匯出成對標記 (alignments) 到 .csv 檔:
匯出 alignments