重新設定文本、種子詞彙與詞夾參數,並據此計算候選詞夾
可
點我
從 DocuSky 取得文獻集內容,或是直接將文本剪貼於以下文字框:(
點我
顯示 DADH2015 展示頁面)
文本內容
可用====(連續四個等號
)
將文本切分為多個章節
種子詞彙
(多個詞彙間以空白或英文逗點隔開)
設定詞夾的至少出現幾個候選詞彙
詞夾
詞夾模具的長度設定:
左夾
詞彙
-
右夾
確定(計算詞夾)
設定各類詞夾,並以選用的種子夾擷取詞彙
C
候選詞夾
新增詞夾:
+
種子詞夾
新增詞彙:
確定(計算詞彙)
設定各類詞彙,並以正確詞彙作為種子,計算新的候選夾
C
候選詞彙
+
正確詞彙
新增詞彙:
確定(計算詞夾)
詞夾參數設定 ‧ 進度存取 ‧ 詞彙詞夾輸出
詞夾參數設定
■ 詞夾模具的長度設定: 左夾
詞彙
-
右夾
■ 詞夾模具的閥值設定: 單一詞夾至少出現
個候選詞彙
■ 標點一致化:是否將中文頓號之外的標點符號,都置換成特殊符號(⊥):
是
否
■ 若有多個種子夾,是否採用鬆散模式:
是
否
確定
進度存取
■ 儲存:將進度儲存於檔案(不含文本內容)
■ 載入:從先前儲存的進度檔還原狀態
確定載入
詞彙/詞夾 輸出
詞彙/詞夾 間的分隔符號:
逗點
換行
檔名:
輸出詞彙
檔名:
輸出詞夾
文本中包含此詞彙或詞夾的片段 (
?
)
本章節的詞彙與出現頻率
詞夾子系統
輸入文本與種子
詞夾 → 詞彙
詞彙 → 詞夾
‧
‧
,
,