Espacenetは、世界各国の特許調査や特許情報入手にとても有用なサイトだが、最近はロボットアクセス対策が強化されたため、拙作のSeleniumBasicを使ったVBAプログラム(PKMなど)を用いて、複数の特許公報を連続ダウンロードするというようなことができなくなった。
まあ、実際にはほとんどの場合で Google Patents から公報データのダウンロードができるので大きな問題にはならないのだが、古い公報などで Google Patents に収録されていないケースもあるので、Espacenetからのダウンロードもある程度自動的にできると助かるのだが。。
一方で、Windowsに標準搭載されている Power Automate Desktop を使えば、各種のWeb操作やExcelとの連携などの一連の操作を自動化することがある程度可能だと知り、少し試してみることにした。
まずは入門書を読み、基本的な使い方を一通り学んだうえで、Espacenetからテキスト公報(タイトル、出願人、発明者、アブストラクト、クレーム、詳細な説明)をダウンロードする操作と、PDF公報をダウンロードする操作の自動化にチャレンジしてみた。
Power Automate Desktop は、手動で行っている1つ1つの操作を再現して実行するというものなので、今回の場合、例えば対象となる公報番号を記載したエクセルファイルを用意しておき、これを読み込んで公報番号を取得し、一方でブラウザを起ち上げ、URLを指定して目的のWebページを開き、テキストボックスに公報番号を入力し、検索ボタンをクリックし、表示されたページで必要なリンクやボタンを適宜クリックし、所望の情報を表示させ、これを抽出してエクセルファイルに転記したり、PDFファイルをダウンロードすする、というような操作を自動で行うことになる。
操作のプログラミングは、通常のプログラム言語を使ったプログラムと中身は同様だが、単位操作ごとにブロックをフローとして並べていくことで作り上げていくので、慣れてしまえば簡単といえば簡単。ただ、無料の Power Automate Desktop の場合、関数機能がないなどの制約もあり、あまり複雑な操作は難しいという難点はあるようだ。
ともかくも、入門書の記載などを参考にして見よう見まねでフローを作り上げてテストしてみたところ、比較的簡単に、思ったような一連の操作を自動的に実施することができた。懸念していたEspacenetでのロボットアクセス判定については、最初にブラウザでEspacenetのサイトを開いたときに「人間であることを確認」というチェックが入るので、Power Automate Desktop による自動操作をする前に、一度手動でEspacenetのページを開き、人間チェックをクリアしておけば、その後に続けて自動操作をする場合、特に問題なく実行できるようだ。
参考までに、PDF公報のダウンロードを行う Power Automate Desktop のフローを示す。
というわけで、まあそんなに多用することはないと思うけど、Google Patents にデータが収録されておらず、Espacenet にはある、というような場合には、Power Automate Desktop を使うという選択肢がありそうだ、ということがわかって、一安心。