電子文書は検索、共有/回覧などが容易であることから、業務効率を大幅に向上でき、保管スペースの削減などのメリットがあり、保存形式としては、今や電子文書の国際規格(ISO 32000-1)となっているPDFが主流となっています。
今や「Windows 10は、PDF表示/PDF形式ファイルへの変換~保存に標準で対応」していますし、「Microsoft OfficeならPDF形式での保存が簡単。MS WordならPDFファイルの編集も可能」となっているのですが、「全文検索」までは対応していません。
今回は、Windows 10のファイルエクスプローラで、膨大な電子文書資料の中から、PDFファイル内に記載されている内容も含めて検索できるようにすることで、必要な書類を探し出しやすくする方法について見ていきたいと思います。
全文検索を可能にするインデックス化
パソコン内に保存されている文書を探し出すには、ファイル名で探し出す方法が最も簡単な方法となりますが、ファイル内に記載されている内容を自動的にスキャンしてインデックス化することで、キーワードで検索ができるようにする「全文検索」機能があります。
これによりデータベース化が自動で行われることになるわけです。
PDFが全文検索の対象になっているか確認する
デスクトップ画面の左下の検索窓で「インデックスのオプション」と入力していきます。
#「いんで」などと入力していく途中で検索結果が表示されることでしょう。
「インデックスのオプション」という表示部分をクリック。
下のような画面が出たら「詳細設定(D)」を開きます。
「ファイルの種類」を開きます。
数多くの「拡張子」の一覧が表示されます。
この一覧の中ほどより下に「pdf」があり、チェックが入っていることと、「プロパティとファイルのコンテンツのインデックスを作成する(C)」がマークされていればOKです。
もしも新たにチェック&マークした場合、ディスク内のスキャンが始まります。「インデックスのオプション」画面に戻ると、「○○○○○個のインデックスが作成されました。」と表示されます。
スキャン~インデックス化作業が終了すると「インデックスの作成は完了しました。」という表示になります。
以上の手順でPDFファイルが全文検索の対象となります。
非力なPCではインデックス化するフォルダーを限定
インデックス化の作業はバックグラウンドで処理が行われるので、非力なパソコンなどの場合、処理が遅くなってしまうかも知れません。
インデックス化させるフォルダーを限定したい場合、上の画像の赤枠部分の「変更(M)」をクリックして、インデックス化するフォルダーを指定することもできます。
PDF全文検索例
PDFをインデックス対象から外している場合
先ほどの「インデックスのオプション」で、PDFをインデックス対象から外している場合の検索結果がどうなるかを、、まずは見てみましょう。
例えば、ファイルエクスプローラで「OneDrive」を選択した状態で「office365」というキーワードで検索してみると、PDFファイルは検索結果として表示されません。
PDFをインデックス対象とした場合
「インデックスのオプション」で、PDFがインデックス対象となっている状態で、同様に検索してみると、PDFファイルが多数検索結果として表示されます。
検索結果が多い場合にはキーワードを増やして絞り込んでみます。
「office 365 出張費」で検索してみると対象ファイルが絞り込まれました。
PDFリーダーで検索
続いて、ファイルを開いてみて、PDFリーダーの検索窓に「出張費」と入れて検索してみると、その検索ワードの表記部分が表示されます。
#PDFリーダーとして、私は機能豊富で軽快動作の「PDF-XChange Viewer」を利用しています。