Export Metadata (and Fulltext) -- extract metadata and content from DocuXml to .csv
English
說明:
讀入一份 DocuXml 檔案,以 csv 格式匯出其 metadata 資訊。
選項:是否需輸出內文:
是
否
讀入 DocuXml 檔案:
輸出csv表單:
匯出 metadata 到 .csv 檔:
匯出 metadata
回上一頁
Metadata規範說明
Metadata規範表連結
給老手的提醒說明
規範表中DocuSky預設的欄位有37欄,可直接使用。
Metadata欄位名稱皆應以拼音形式進行設定,例如:「摘要」欄,欄位名稱應設定為「abstract」。
使用者除設之37欄外,如有欲新增的欄位,或希望顯示於DocMeta中的欄位,須在欄位名稱前加上”metadata/”,例如:欲新增「abstract」欄位,則設定為”metadata/abstract”。
如欲新增可超連結的欄位,須設定A、B二欄,且次序不得更動,A欄設為”metadata/欄位名稱”,內容填錄欲顯示的文字;B欄設為”metadata/欄位名稱.href”,內容填錄欲超連結的URL。
如欲設定多值欄位,則須設定為”metatags/欄位名稱”,內容填錄為”值1;值2;值3”。例如:該文件有多位作者,則可以設定欄位名稱為「metatags/作者」。資料庫填錄規則是以';'區分欄位值,例如:作者A;作者B;作者C。本欄需於metadata欄位管理工具中設定顯示,才能於後分類中出現。
若Metadata表單中有內容為空白,代表跳過不處理。
在文字庫XML檔案中以"-"代表「沒有metadata」,因此想刪去某個metadata的話只要在對應的位置填入"-"。
預設是以第一欄(A欄)為索引對應欄(規範表中是filename)。若想以其他欄當作索引,可在該欄名稱前方加上#。例如:想改以docclass作索引欄,則設定為”#docclass”。
若在第一欄(索引欄)標頭後加上"^="或是"$=",可只對應前綴詞或後綴詞。例如:標頭設定為”filename^=”,內容填「A001」,則則此工具會找到所有filename為A001開頭的document;若為"filename$=",會找出所有filename以A001結尾的document。
若多個欄位名稱分別為 名稱A:1, 名稱A:2, ..., 名稱A:n,此工具會將這些欄位的值串接起來,儲存於「名稱A」的標籤中。
若希望某欄的值,例如值為「A001」,可被放在多個標籤中,可在欄位名稱利用逗號區隔標籤來指定,名稱A,名稱B,...,名稱Z)。如此,「A001」將會被放在”名稱A””名稱B”…”名稱Z”各欄中,不需將該值拷貝至多欄中。
若在欄位名稱前加上 "!",則儲存格中的字串將會以原貌加入 XML(而不會被 escape 處理)。 使用者必須自行負責讓最後的結果是一份 valid XML。
若在欄位名稱後加上 ";",則工具會將多個有相同索引(index key)的欄位內容串連起來(之間用 ";" 銜接)。
filename
Author;
A001
作者A
A001
作者B
⇒
filename
author
A001
作者A;作者B
Loading
progress: