說明 1: | 這個工具可以讓您指定UTF-8 編碼格式的文字檔,將它們輸出為本地端的 XML 檔,便於建構個人資料庫。 |
| 您可將多份文字檔打包成一個文獻集,並指定這個文獻集的名稱。 |
|
* 若文字檔並非 UTF-8 編碼,該如何處理?
如果文字檔並非以 UTF-8 編碼,可利用 Windows 的「記事本」,依照以下步驟轉成 UTF-8格式:
1. 用「記事本」開啟指定(例如以 BIG5 或 GB 編碼)的 .txt 檔(例如:a.txt)。
2. 從功能列選擇「功能表」/「檔案」/「另存新檔」。
3. 在「另存新檔」對話框中最下方的「編碼」選擇「UTF-8」,「存檔類型」選擇「所有檔案」,並在
「檔名」輸入新檔名(例如:b.txt),再按下「儲存」。
* 如果儲存的檔名跟舊檔名一樣(例如都是 a.txt),舊檔案會被覆寫。
|
說明 2: | (a) 自動分件: 1. 在文字檔中欲分件處輸入4個# (i.e. ####),便能實現自動分件的功能。 |
|
2. 分件檔名預設為原始文件檔名依序加上編號(i.e. 原始文件檔名_xxx)。 |
|
3. 分件檔名及內容皆可於檢視中更改,若無此需求亦可略過直接點擊儲存。 |
| (b) 自動分段: 1. 在文字檔中欲分段處輸入Enter或Return (文章頭尾可略),也就是空一行的意思,便能實現自動分段的功能。 |
|
2. 系統預設文字檔每一行開頭超過2個全形(4個半形)空格則不分段只換行,利用此特性亦能實現自動分段的功能。 |