DocuSkyBETA 從建庫 XML 中,挑選文獻集與文件,再將它們輸出為新建庫 XML 檔的工具 首頁 | 我的資料庫
說明: 此工具可讀入多份 ThdlExportXml 檔,讓使用者挑選其中的文獻集(可利用檔名篩選欲輸出的文件),並將這些文獻集彙整成單一檔案。 您也可以利用這份工具將文件中的段落(paragraphs,相當於 Markus 的 passages)轉換成獨立的文件。

[註]: 此工具目前只能將多個 "單一corpus文件" 合併成一份 "複數corpus文件"

1. 讀入 ThdlExportXml 檔案:
已載入的檔案:
檔名 文件數 檔案中所包含的參考資料或文獻集


2. 若想對步驟 1 所勾選文獻集文件進行篩選,請勾此選項: 利用檔名過濾輸出文件


3. 若想將輸出的文件通通彙整到新的單一文獻集,請勾此選項: 將挑選的文件放入單一文獻集


4. 若想將文件中的段落 <Paragraph> 轉換成個別獨立的新文件,請勾此選項: 將文件中的段落轉換成文件


5. 輸出: DocuXml tsv (filename and metadata)
欲儲存的建庫檔名: