Find Relevance Documents Tool
This tool can help find More Relevant Documents by Relevance Feedback.
Step 1:
click "Load corpus from DocuSky" button on the top navigate bar
目的:
提供一個非傳統關鍵字檢索文獻的方式
概述:
使用者從DocuSky上選擇一個文獻集, 根據使用者挑選的相關條目, 利用Relevance Feedback演算自動擷取相關條目特徵, 推薦給使用者與選定相關條目高度相似的條目, 以利使用者找尋所需條目。
第一步:點選此按鈕呼叫DocuSky文獻庫
第二步:輸入個人的DocuSky帳號密碼
第三步:選擇欲使用的文獻集
第四步:
(一)成功進入工具主頁
(二)可於畫面上方此處查看"目前讀入的文獻集"與"文獻集大小"
(一) 使用者依序瀏覽條目,點選每份文件右方按鈕將每份條目分類至三種類別
(二)三大類集合介紹
類別一:
相關(Relevant),使用者認定相關的條目
分類後條目呈現綠色
類別二:
不相關(Irelevant),使用者認定不相關的條目
分類後條目呈現灰色
類別三:
待決定(Pending),使用者未能決定相關/不相關的條目
分類後條目呈現藍色
(三)關鍵字檢索
操作方法: 1. 輸入欲檢索關鍵字(e.g.臺灣) --> 2. 點擊此案扭送出搜尋
檢索結果: 條目表中會highlight使用者輸入的關鍵字,並可在上方的進度顯示欄看到總檢索到的條目數。
(一)可在表格的上方左右兩邊,找到上下頁的按鈕,中間的進度顯示列可參考(二)的詳細介紹
(二)進度顯示列個數值詳細介紹如下:
(三) 當使用者覺得已收集到定量的相關條目,可進行重算分數的動作,已分類文件將不會再被計算並不會顯示在瀏覽條目頁面 ,剩餘條目會經由Relevacne Feedback演算方法計算相關度後由大到小排序輸出。以下有兩種情況,條目會重算相關度。
情況一: 重新查詢相同關鍵字或查詢不同關鍵字,會計算符合該關鍵字下條目的相關度。
情況二: 點擊頁面最下方"重算"按鈕,此會計算所有剩餘條目的相關度,計算完後回到瀏覽所有條目的頁面
(一) 除了顯示目前各類別的數量外,點擊此列按鈕後,可進入瀏覽該類別所有條目
(二)
點擊"Back to View All Documents"按鈕可回到原本檢索畫面,
點擊"Export"可輸出分類條目清單的txt檔案(檔名與條目內文),
也可在每個條目右方按鈕列更改條目分類。
(一)本工具中紀錄檔有兩種形式:
1. Prototype Vector:
系統抽取相關條目與非相關條目特徵,所得出的特徵向量。可載入到不同的條目集,進行跨條目集的相關度回饋搜尋。
例如:使用者在已利用本工具在某一文獻集進行臺灣相關條目的搜索,利用這個Prototype Vector,可在使用者在進入另一個不同文獻集也要進行臺灣相關條目搜索時,提供系統初步臺灣相關條目的特徵。。
檔案形式:.json
2. Classified Record:
記錄使用者已在本文獻集所分類的條目,可方便使用者下次回到此工具時,還原上次進行的結果。不可跨文獻集讀取。
檔案形式:.json
(二)儲存操作:
步驟一:點擊畫面最上方黑色橫槓中的"Save Record"
步驟二:選擇所要存的紀錄檔形式,點選後可存到使用者電腦中。
(三)讀檔操作:
步驟一:點擊畫面最上方黑色橫槓中的"Load Record"
步驟二:選擇所要讀取的檔案,點選後可讀入工具中。
打開進階功能列表:點擊畫面左側的"Show Tool",即可呼叫出進階工具
工具列表如下:
(一)highlight字詞:
步驟一:點擊"highlighter"後顯示highlighter工具
步驟二:輸入欲highlight的字詞(以換行做分隔),完成後點擊"Submit"
操作結果:各條目內所需highlight詞彙已被highlight
(二)顯示相關度分數:
點擊"Show RelScore"後顯示可顯示條目經Relevance Feedback計算出來的相關度分數
操作結果:相關度分數會顯示在每一條目檔名後方,亦可再次點擊"Hide RelScore"隱藏分數
(三)設定prototype Vector的時間點(三種模式):
1. 每次assessment更動時(Access): 當使用者更改一條條目的分類時,Prototype Vector馬上就會被更動。
2. 每次pager需讀取下一頁面時(i.e.從DocuSkyLoader撈資料)(Chunk): 當使用者瀏覽完一頁,會將該頁使用者更改的條目分類,對Prototype Vector進行更動。
3. 每次搜尋new Query時(Query): 當使用者確定進行重新計算文件的動作,才會對Prototype Vector進行更動。
更改處如下圖所示:
(四)設定從DocuSky讀取時會讀入幾個chunk(三種模式):
1. minimal mode(min): 每次僅會從DocuSky讀取下一個Chunk的條目
2. maximal mode(max): 一次從DocuSky讀取所有該文獻集的所有條目
3. Smart mode(smart): 根據目前使用者操作的狀況,從DocuSky讀取不定量的Chunk
更改處如下圖所示: