ライブラリ内の重複文献を削除しよう


Find Duplicatesで重複した文献を一括で削除することができます。

EndNoteには重複して取り込んでしまった文献を簡単に抽出・除去することが可能な[Find Duplicates]という機能があります。

本稿では[Find Duplicates]の設定と手順を説明します。

  1. 重複抽出の設定
  2. 重複の抽出・削除
  3. 文献情報の更新

重複抽出の設定

重複削除の前に設定を確認しましょう。

  1. 【Windows】
    EndNote メニューバーで [Edit] → [Preferences...] の順にクリック。
    【Macintosh】
    EndNote メニューバーで [EndNote 20] → [Preferences...]の順にクリック。

  2. [EndNote Preferences] 画面で、左側のリストから [Duplicates] を選択します。

  3. [Compare references based on the following fields]と[Criteria]で、重複を判断する基準となる項目を選択します。

[Compare references based on the following fields]はデフォルトでは、以下の4項目にチェックマークが付けられており、これら4項目が一致したレコードを重複とみなすよう設定されています。

  • ・Author
  • ・Year
  • ・Title
  • ・Reference Type

[Criteria]はデフォルトでは[Ignore spacing and puctuation]となっており、スペースと句読点は無視します。[exact match]にすると、スペースと句読点も一致していない場合は重複とみなされません。

基本的には、これらの項目は設定を変更しなくても問題ありません。

注意点としては、チェックを付けた項目が多いほど厳密ですが、異なるデータベースから取得した場合はデータ内容が完全に一致しているとは限らないため、重複が見落とされる可能性があります。必要以上にはチェックを付けないようにしましょう。

特にAuthor欄は表記がフルネームであったり、First Nameのみイニシャルであったりと、データ取得先によって異なることがあります。

取得先が異なるため、同一文献でAuthor情報に表記ゆれがある例

そのような場合、文献情報を最新情報に更新する[Find Reference Update]を使用して文献情報を更新しておくと、表記が統一され抽出漏れを防ぐことができます。
▼[Find Reference Update]へ

その他、ライブラリ内の重複抽出の漏れを無くすために一度重複削除した後、項目を変更して再度重複抽出をおこなうなど、設定を変えて複数回[Find Duplicates]をおこなって重複を抽出するやり方もあります。
例. 最初はデフォルトの4項目で重複削除した後、「Title」と「Year」のみで再度実行するなど

また、EndNote 20からはチェック項目に「DOI」、「PMCID」が追加されています。これらは文献に対する固有のIDなので、表記ゆれなど関係なく確実に重複とみなすことができます。文献情報に「DOI」や「PMCID」が入力されている場合は、これらの項目を指定すると確実に重複を抽出することが可能です。
例. 「DOI」のみで重複抽出

重複の抽出・削除

  1. EndNote メニューバーで [Library] → [Find Duplicates] の順にクリックします。

  2. [Find Duplicates] 画面に、重複レコードが左右に並んで表示されます。残したいほうのレコードの[Keep This Record]をクリックすることで重複を削除します。
    大量の文献がある場合[Cancel]をクリックして、ウィンドウを閉じます。

  3. [Cancel] をクリックすると [Find Duplicates] 画面が閉じられ、ライブラリ画面には重複レコードが表示されます。

    重複しているレコードのうち、より最近ライブラリに取り込まれたレコードが反転されて表示されます。

  4. EndNote メニューバーの [References] → [Move References to Trash] をクリックします。重複レコードとして反転表示されていたレコードがライブラリ画面から削除されます。

  5. これで重複削除の完了です。

〜応用〜 重複抽出時に古い文献を一括削除する

上記3.の[Find Duplicates]実行時、ライブラリ画面には重複レコードが表示され、より最近ライブラリに取り込まれたレコードが反転されて表示されます。少し手間がかかりますが、古い文献を一括削除することも可能です。

  1. まず、抽出用にグループを作成します。残す重複文献用のグループと、重複全体を入れる2グループを作ります。
    グループセットにカーソルをあわせて右クリックし、表示されるメニューの「Create Group」をクリック。

  2. 名前[重複(残す)など]を入力し、グループを作成。同様に[重複]のグループも作ります。

  3. EndNote のメニューバーの[Library] > [Find Duplicates]を実行

  4. 出現する重複文献の比較画面を[Cancel]で閉じる

  5. ライブラリ画面で、重複と判定された各文献のうち「あとにライブラリに取り込まれた文献」が一括で選択されているので、その選択を解除しないよう、選択されている文献をまとめて残すほうのグループに入れる。

  6. 選択を解除し、重複と判定されたすべての文献を[重複]のグループに入れる

  7. グループパネルの上で右クリックし、[Create from Groups]を選択

  8. 出現した画面で、一番上の[Select a Group]を重複全体が含まれるグループに設定。一段下の左側の[And]を[Not]に変更。[Not]の右隣の[Select a Group]を残す用のグループに設定し、[Create] を実行。

  9. 新たに作成されたグループには[重複]と判定された文献のうち[重複(残す)]に所属していない文献のみが一覧表示されます。

  10. この新たに作成されたグループ内の文献を[Move References to Trash]ですべて削除します。

これで古い文献のみを削除することができます。

文献情報の更新

取得した文献情報はデータベースごとに内容が異なっていることがあります。そのため、事前に[Find Reference Update]で文献情報を更新し、統一するのがオススメです。

  1. [Find Reference Update]を実行するには、文献を選択し、右クリックでメニューを開き、[Find Reference Update]をクリックします。

  2. 更新情報が表示されるので、[Update All Fields]、または[Update Empty Fields]などを選択し、更新します。

  3. 複数のレコードに対し本機能を使用した際、[Update All Fields] または [Update Empty Fields] をクリック後に現れるウィンドウで [はい](Windows) または [Yes](Macintosh) をクリックすると、選択していたすべてのレコードに対して同様の処理を行います。
    [いいえ] をクリックすると、次のレコードのアップデートへ進みます。

まとめ

重複削除はEndNoteの基本的かつ、重要な機能です。システマティックレビューの際にも便利ですので、ライブラリ管理にお役立てください。
▼関連 EndNoteをシステマティックレビューに活用する