「知的財産」カテゴリーアーカイブ

Power Automate Desktop で Espacenet にアクセス

2025/03/12VBA、知的財産sawaki

Espacenetは、世界各国の特許調査や特許情報入手にとても有用なサイトだが、最近はロボットアクセス対策が強化されたため、拙作のSeleniumBasicを使ったVBAプログラム（PKMなど）を用いて、複数の特許公報を連続ダウンロードするというようなことができなくなった。

まあ、実際にはほとんどの場合で Google Patents から公報データのダウンロードができるので大きな問題にはならないのだが、古い公報などで Google Patents に収録されていないケースもあるので、Espacenetからのダウンロードもある程度自動的にできると助かるのだが。。

一方で、Windowsに標準搭載されている Power Automate Desktop を使えば、各種のWeb操作やExcelとの連携などの一連の操作を自動化することがある程度可能だと知り、少し試してみることにした。

まずは入門書を読み、基本的な使い方を一通り学んだうえで、Espacenetからテキスト公報（タイトル、出願人、発明者、アブストラクト、クレーム、詳細な説明）をダウンロードする操作と、PDF公報をダウンロードする操作の自動化にチャレンジしてみた。

Power Automate Desktop は、手動で行っている１つ１つの操作を再現して実行するというものなので、今回の場合、例えば対象となる公報番号を記載したエクセルファイルを用意しておき、これを読み込んで公報番号を取得し、一方でブラウザを起ち上げ、URLを指定して目的のWebページを開き、テキストボックスに公報番号を入力し、検索ボタンをクリックし、表示されたページで必要なリンクやボタンを適宜クリックし、所望の情報を表示させ、これを抽出してエクセルファイルに転記したり、PDFファイルをダウンロードすする、というような操作を自動で行うことになる。

操作のプログラミングは、通常のプログラム言語を使ったプログラムと中身は同様だが、単位操作ごとにブロックをフローとして並べていくことで作り上げていくので、慣れてしまえば簡単といえば簡単。ただ、無料の Power Automate Desktop の場合、関数機能がないなどの制約もあり、あまり複雑な操作は難しいという難点はあるようだ。

ともかくも、入門書の記載などを参考にして見よう見まねでフローを作り上げてテストしてみたところ、比較的簡単に、思ったような一連の操作を自動的に実施することができた。懸念していたEspacenetでのロボットアクセス判定については、最初にブラウザでEspacenetのサイトを開いたときに「人間であることを確認」というチェックが入るので、Power Automate Desktop による自動操作をする前に、一度手動でEspacenetのページを開き、人間チェックをクリアしておけば、その後に続けて自動操作をする場合、特に問題なく実行できるようだ。

参考までに、PDF公報のダウンロードを行う Power Automate Desktop のフローを示す。より詳細を知りたい方は、ご連絡ください。

というわけで、まあそんなに多用することはないと思うけど、Google Patents にデータが収録されておらず、Espacenet にはある、というような場合には、Power Automate Desktop を使うという選択肢がありそうだ、ということがわかって、一安心。

Google Patents データ更新停止からの完全復旧！！（2025/02/17）

2025/01/16知的財産sawaki

いつも仕事などで大変お世話になっているGoogle Patents（https://patents.google.com）だが、昨年12月頃から、データベースのアップデートが滞り、新規データが追加されていない状態が続いていたのだが、2025/02/12になって、少なくとも一部のデータの更新が行われたことが確認され、さらに2025/02/17には、途中の抜けていたデータも埋まり、問題なく使用できる状態に戻ったとみられる。

2025/02/10の時点では、Google Patentsに収録されている最新のデータは次の通りだった。
　JP：特開2024-161626（2024/11/19発行）
　　　特許7587090（2024/11/19発行）
　US：US2024/381800（2024/11/14発行）
　　　US12,150,394（2024/11/19発行）
　WO：WO2024/234021（2024/11/14発行）
　EP：EP4462987（2024/11/13発行）
　CN：CN118985183（2024/11/19発行）

2025/02/12の時点では、どうやら2024年に発行され、Google Patentsに収録されていない公報は、まだ未収録のままだが、2025年発行の公報は、順次収録されているというような状態に見えていたが、2025/02/17には、この抜け落ちていた部分も無事に収録されたとみられる。この間、約2.5か月。とても心配したが、本当によかった。

Excel VBAを使用してJ-PlatPatから公報テキストをダウンロードする方法（７）

2021/05/21VBA、知的財産sawaki

１４．経過情報照会ページ（各書類）を開く

ここでは上図に示した「経過情報表示」の「経過記録」のページにリンクされている各書類（明細書、拒絶理由通知書、手続き補正書、意見書など）を１つずつ開き、内容を読み込む方法について説明しようと思う。この処理は従来までの手法よりもやや複雑になるのだが、その理由として、まず、ここにどんな名称の書類がどの順で表示されているのかは、公報１つ１つ違うので、このページ内に多数存在しているAタグのうち、どれをクリックすればよいのか判断するのが難しいこと、さらには、同じ名称を有する複数の異なる書類（リンク）が存在している場合があること（上図のケースでは拒絶理由通知書、手続き補正書、意見書が3通ずつ存在している）などが挙げられる。

この「経過記録」のページに表示されている書類は、「審査記録」、「審判記録」、「PCT国際出願記録」の３つのブロックに分けて記載されている（審判記録とPCT国際出願記録のブロックは、該当する書類が存在する公報でのみ表示される）ので、それぞれのブロックごとに分割して処理する方法も考えられるが（拙作ツール「JPPD」ではそうしている）、ここでは全部まとめて処理する方法を紹介する。

このページの中には、クリックしたい⑩「特許願」などの書類名称へのリンク以外にも、ページ左上の「J-PlatPat」へのリンクや、「登録6621446」や「査定不服審判2019-013295」へのリンク、⑨「出願情報」ページへのリンクなどに加え、「拒絶理由条文コード」へのリンクなども含まれている。この中で、必要な書類へのリンクと不要なリンクを選定・判別する必要がある。

このページのソースを詳しく眺めてみると、⑩「特許願」などの書類へのリンクは <a class=”xx” で始まるAタグとなっているのに対し、「拒絶理由条文コード」へのリンクは <a style=”xx” で始まるAタグとなっている。その他の「J-PlatPat」へのリンクや、「登録6621446」などへのリンクは、<a class=”xx” で始まるAタグ、<a style=”xx” で始まるAタグ、さらには<span で始まるSPANタグが混在している状態のようである。これらのリンクの中から、クリックしたいリンクだけをどうやって選び出すのか、いくつかの方法が考えられるが、ここでは、そのうちの１つの方法を、以下に示す。

Dim flag As Integer
flag = 0

For Each objtag In objIE3.document.getElementsByTagName(“a”) Then
If InStr(objtag.outerHTML, “<a class=”) > 0
If InStr(objtag.text, “特許願”) > 0 Then
flag = 1
ElseIf InStr(objtag.text, “TOP”) > 0 Then
flag = 0
End If

If flag =1 Then
objtag.Click

－－－－－－－－－－－－－－－－－－－－－－－－－－－－
新たに開いたウィンドウをオブジェクト変数（objIE4など）に取り込み
ファイルに書き込むなり、変数に取り込むなりの処理を行い
その後、開いたウィンドウを閉じる処理を行う
－－－－－－－－－－－－－－－－－－－－－－－－－－－－

End If
End If
Next

上のコードを解説すると、「経過情報表示」ページの全てのAタグを順番に（左上から右下に）調べ、<a class= で始まるタグだけを選び出し、さらにそれが「特許願」以降で「TOP」より前のタグに限定して（flag = 1 のときだけ）、そのAタグをクリックしている。

多くの例を確認してみたところ、最初にクリックすべき書類名称は、ほとんどが「特許願」だが、稀に「出願審査請求書」となる場合（古い公報）や「国内書面」となる場合（PCT出願の場合）があるようなので、実用上は、これら３つのいずれかであれば flag = 1 とするのが良いだろう。一方、最後の書類名称は特定できないのだが、最後の書類の次のAタグは、たぶん必ずこのページの右下にある「↑」で、ソースコード上は「TOP」と表記されているAタグなので、このようなコードによって、必要な文書のリンクだけを次々とクリックできる（ようだ）。

なお、このようにして書類名称を次々とクリックして得られる書類は、たまたま同じ名称の場合があるので、例えばクリック回数 i をカウントし、書類名称の後に “_i” や “(i)” といった形で文書名にカウントを付加することで区別するような工夫をすればよいだろう。

Excel VBAを使用してJ-PlatPatから公報テキストをダウンロードする方法（６）

2021/05/20VBA、知的財産sawaki

１２．「図面」を入手

ここまでで、目的の公報の文献表示画面から、書誌、要約、請求の範囲、詳細な説明を全て「開いた」状態にした後に、その内容をテキストファイルにダウンロードすることができたと思う。ここではさらに、図面もダウンロードしてみようと思う。

このためには、「請求の範囲」や「詳細な説明」を開くのと同様の処理で、「図面」の「開く　＋」をクリックしてやり、折り畳まれている図面セクションを開いた後に、objIE2.document.body.innerHTMLをファイルに書き込むなり、変数に取り込むなりの操作を行う。しかし、このままでは図を表示させることはできない。

この部分のソースコードを「要素の検査」にて見てみると、下に示すように、複数の図が、<img id=”〇〇” style=”△△” alt=”◇◇” src=”xx.jpg”> といった形式で記載されている。

このうちの src=”xx.jpg” の xxの部分が図面へのリンクを示すURLの一部となっており、xxの前に “https://www.j-platpat.inpit.go.jp/” を付け加えれば、この図が表示されるリンク先URLが得られるようである。そこで、図面のリンクURLが記載されている部分を書き換えてやればよいことになる。具体的には、このページのソースの中から”【図１】”以降の部分を取り出し、次に示すような処理を行うことで、その中の、src=”xx.jpg” の”xx”の部分を、”https://www.j-platpat.inpit.go.jp/xx.jpg” に文字列置換してやればよい。

Dim temp As String
Dim k As Integer

k = InStr(objIE2.document.body.innerHTML, “【図１】”)
temp = Mid(objIE2.document.body.innerHTML, k)

temp = Replace(temp, “src=” & Chr$(&H22) & “/gazette”, “src=” & Chr$(&H22) & “https://www.j-platpat.inpit.go.jp/gazette”)

１３．「経過情報」を入手

ここからは、少しややこしい処理になるが、経過情報および審査記録などの各種書類の入手処理について示す。この処理は、いろいろな公報の経過情報ページを開き、そのソースを眺め、試行錯誤を繰り返しながら、どうにか思ったような結果が得られる処理手順を見つけたもので、あまりきれいな処理とは言えない。この処理を行うやり方は他にも色々とあるだろうと思うし、もっとずっとエレガントな処理方法があるのではないかと思うので、ここにあげたやり方を参考に、各自でより良い方法を考えて欲しい。

まずは、下図に示すように、「書誌」「要約」「請求の範囲」「詳細な説明」および「図面」を入手した「文献表示」ページにおいて、⑧で示した「経過情報」のボタンを探し、これをクリックすることで、「経過情報表示」ページを開く（このページは新たなウィンドウ（タブ）で開く）。この処理は、固定URLを表示させるために行った「URL」ボタンのクリック処理と同様である。

For Each objtag In objIE2.document.getElementsByTagName(“a”)
If InStr(objtag.outerHTML, “経過情報”) > 0 Then
objtag.Click
Exit For
End If
Next

Set objtag = Nothing

上の操作によって表示される下図に示す「経過情報表示」ページは新たなウィンドウがタブで開き、「経過記録」のページが表示されているので、これをオブジェクト objIE3 に取り込んでやる。

Dim objIE3 As InternetExplorer
Dim shl As Object
Dim win As Object
Dim targetTitle As String

flag = 0
i = 1
targetTitle = “経過情報表示”

Do While flag = 0 And i < 300
For Each win In shl.Windows
DoEvents
If win.Name = “Internet Explorer” Then
If InStr(win.document.title, targetTitle) > 0 Then
Set objIE3 = win
flag = 1
Exit For
End If
End If
Next
Application.Wait [Now()] + 100 / 86400000
i = i + 1
Loop

これにより「経過記録」のページが objIE3 に取り込まれたので、objIE3.document.body.innerHTML をファイルに書き込むなり、変数に取り込むなりすれば、その後、このページ内容に対してさらなる操作が可能となる。（実際には、次の処理を行う前に、ここでページの読み込みが完了したことを確認する処理が必要となるが、省略する。例えば「明細書」という文言が表示されるのを待つ等。）

次に、このページにて、「拒絶理由通知書」や「意見書」などの各書類の内容を取得しようとすると、ここまでとは少し異なる結構処理が必要となる。これについては、長くなりそうなので、新たな記事を立てて説明することにしたい。

一方で、このページには「経過記録」の他に、⑨で示すように「出願情報」、「登録情報」、「審判情報」および「分割出願情報」のページが開くリンクが表示されている。（経過記録と出願情報は全ての公報について表示されるが、その他のページは該当情報が存在している公報でのみ表示される。）ここでは、これらをクリックして「出願情報」や「登録情報」などのページを表示させる方法について示す。

例えば「出願情報」を開くには、「出願情報」というリンク⑨をクリックすればよいのだが、このページの関連部分のソースを見てみると、

<div class=”type_tab ng-star-inserted” _ngcontent-wdl-c420=””>
<span _ngcontent-wdl-c420=””>出願情報</span>
</div>

となっており、このリンクは通常のAタグではなく、SPANタグとなっている。とはいえ、Aタグの処理の時と同様にSPANタグをクリックすることで、無事に所望のページが開くので、例えば「出願情報」をクリックする操作は、次のようになる。

For Each objtag In objIE3.document.getElementsByTagName(“span”)
If InStr(objtag.outerHTML, “出願情報”) > 0 Then
objtag.Click
Exit For
End If
Next

Set objtag = Nothing

Do While objIE3.readyState <> 4 Or objIE.Busy
DoEvents
Loop

この操作により表示される「出願情報」のページは、今まで「経過記録」が表示されていたページを書き換える形で開くので、オブジェクト objIE3 に取り込まれる。従って、特段の操作は必要なく、objIE3.document.body.innerHTMLを読み込むことで必要な情報が入手できる。

さらに、これと同様の処理によって、「登録情報」「審判情報」「分割出願情報」の各ページを開き、内容を読み込むことができる。（「出願情報」「登録情報」「審判情報」は、基本的に文字のみがhtmlのTable形式で表示されているページなので、単純にテキストとして処理できるが、「分割出願情報」は、各出願の間の関係が図示されており、そのまま内容をコピーして表示させると、公報番号などが黒塗りされたりしてうまく表示できないので、うまく表示させるためには工夫が必要なようだ。）

Excel VBAでSeleniumBasicを使用してChromeを操作し、J-PlatPatから公報をダウンロードする方法

2020/10/27VBA、知的財産sawaki

ここまで、Excel VBAを使ってインターネットエクスプローラ（IE）を制御することで、J-PlatPatから特許公報テキストをダウンロードすることができるようになった。ところが、どうやらマイクロソフトは IE を見限ったようで、今後は徐々にサポート対象外となるような話が出ている。VBAでインターネットにアクセスし、ウェブページを操作したり、データをダウンロードしようとしたら、現時点ではIEを使うのが手っ取り早い方法ということになるが、今後はそれがどうなるのか、今の時点では特にアナウンスはされていないようだ。

また、IE だと、Espacenet にアクセスしても一部の公報で表示がうまく行われないという現象も見られるようなので、何とかしたいと考えていたところでもあり、この際、IE以外のブラウザを操作して、インターネットからデータをダウンロードする方法として、SeleniumBasic を使用した Google Chrome の操作にチャレンジしてみた。

ここでは、IEを操作するマクロと比較しやすいように、ここまで説明してきた J-PlatPat からテキスト公報をダウンロードする操作と全く同じ動作をするマクロを、SeleniumBasic を使用して行うことにした。IEを操作するマクロの詳細については、「Excel VBAを使用してJ-PlatPatから公報テキストをダウンロードする方法」の（１）、（２）、（３）、（４）、（５）を参照いただきたい。

１．準備

Excel VBAでSeleniumBasicを使用してGoogle Chromeを操作するためには、SeleniumBasicのインストール、Chromeドライバーのインストール、Excel VBAへの参照設定といった事前作業が必要となる。これらの作業については、いくつかのサイトで丁寧に説明がなされているので、これらを参照願いたい（例えば、以下のサイト）。

　・VBAのスクレイピングを簡単楽にしてくれるSelenium
　・非エンジニアにこそ伝えたいSeleniumBasic
　・Seleniumを使ってVBAからchromeブラウザ操作(VBA編)

２．J-PlatPatのトップページを開く

最初に、Chromeを立ち上げ、J-PlatPatのトップページを開く。既にChromeが立ち上がっている場合には、それとは別の新たなウィンドウで立ち上がる。なお、SeleniumBasicが立ち上げた新たなChromeのウィンドウの左上には「Chromeは自動テストソフトウェアによって制御されています。」という表示が出る。

Dim Driver As New Selenium.WebDriver
Dim url As String

url = “https://www.j-platpat.inpit.go.jp/”

Driver.Start “chrome”
Driver.Get url

Do While InStr(Driver.PageSource, “>検索<“) = 0
DoEvents
Application.Wait [Now()] + 100 / 86400000
Loop

所定のURLのサイトを開くところまでは特に問題はない。SeleniumBasicの場合、ブラウザがビジーの間は処理が戻ってこないようなので、IE制御の場合にはお約束のように多用した objIE.readystate と objIE.Busy をチェックする Do While ループは必要ない。それでも、表示が完了したかどうかのチェックは必要なので、ここではHTML中に”>検索<“が含まれていることが確認できるまで待機している。なお、IE制御のときの objIE.document.body.innerHTML に該当するのが、SeleniumBasic では Driver.PageSource である。

３．公報番号を入力し、検索ボタンをクリックし、検索結果一覧の表示完了を確認する

Dim patnum As String
Dim i As Integer
patnum = “特開2018-010101”

Driver.FindElementById(“s01_srchCondtn_txtSimpleSearch”).Clear
Driver.FindElementById(“s01_srchCondtn_txtSimpleSearch”).SendKeys patnum
Driver.FindElementByName(“s01_srchBtn_btnSearch”).Click

i = 1
Do While InStr(Driver.PageSource, “特願”) = 0 And i < 300
DoEvents
i = i + 1
Application.Wait [Now()] + 100 / 86400000
Loop

前半部分では、テキストボックス”s01_srchCondtn_txtSimpleSearch”に公報番号を入力し、検索ボタン”s01_srchBtn_btnSearch”をクリックしている。IE制御の際には、何やらややこしい操作が必要だったのだが、SeleniumBasicでは教科書通りに SendKeys でテキストを送信し、ボタンをクリックすることで問題なく検索される。ただし、テキストボックス内に既にテキストが入っている場合には、それに追加されてしまうので、事前にクリアしてからテキストを送信するようにしている。

後半部分では、検索結果一覧表が表示されたことを確認するため、”特願”という語句が検出されるか、または繰り返し回数が300回となるまで、ループさせている。

４．検索結果一覧にて公報のリンクをクリックし、文献表示画面を取り込む

Dim wEle As WebElement
Dim flag As Integer

flag = 0
i = 1
Do While flag = 0 AND i < 300
For Each wEle In Driver.FindElementsByTag(“a”)
If InStr(wEle.Text, patnum) > 0 Then
wEle.Click
flag = 1
Exit For
End If
Next
Application.Wait [Now()] + 100 / 86400000
i = i + 1
Loop

Set wEle = Nothing

ここでは、Driverの中に含まれるすべてのAタグの中から、所望の公報番号をテキストとして持っているAタグを見つけ、これをクリックする。この部分では使っている関数名が微妙に異なっているが、IE制御のときとほとんど変わりがない。クリック操作により、特許・実用新案文献表示画面が別ウィンドウで表示される。

このままでは、オブジェクト変数Driverには、まだ最初のウィンドウが入ったままであり、新たに開いたウィンドウの操作ができないので、切り換える。IE操作の際には、ここで立ち上がっている全てのウィンドウの中から所望のウィンドウを探し出し、そのウィンドウをオブジェクト変数に取り込む必要があったが、SeleniumBasicでは、次の1行で済む。

Driver.SwitchToNextWindow

これで新たに開いたウィンドウが、変数Driver に取り込まれるのだが、この後このウィンドウを閉じて、元のウィンドウを操作したりする際に、今どのウィンドウを操作しているのかわかりにくいので、次のように明示的にウィンドウを取り込む方法の方が良いかもしれない。

Dim targetTitle As String

targetTitle = “特許･実用新案文献表示｜J-PlatPat [JPP]”
Driver.SwitchToWindowByTitle (targetTitle)

５．「要約」、「請求の範囲」、「詳細な説明」を開く

i = 1
Do While InStr(Driver.PageSource, “図面”) = 0 And i < 300
DoEvents
i = i + 1
Application.Wait [Now()] + 100 / 86400000
Loop

For Each wEle In Driver.FindElementsByTag(“a”)
If InStr(wEle.Text, “要約”) > 0 And InStr(wEle.Text, “開く”) > 0 Then
wEle.Click
i = 1
Do While InStr(wEle.Text, “開く”) > 0 And i < 300
DoEvents
Application.Wait [Now()] + 100 / 86400000
i = i + 1
Loop
Exit For
End If
Next

Set wEle = Nothing

最初に、文献表示画面にて、”図面” という語句が表示されたのが確認されるまで、待機し、その後、折り畳まれていた「要約」のリンクをクリックして内容を表示させている。要約の内容が表示されると、「要約」のリンクの右側の「開く　＋」が「閉じる　－」に変わるので、「開く」が消えたことが確認されるまで待機している。

2021/02/03　ここの部分、J-PlatPat側の仕様変更に伴い、修正。
　文献表示画面にて、最初から「要約」が開いた状態で表示されるように変更になったので、「要約」のリンクを見つけ、その横に「開く　＋」の表示がある場合には「要約」のリンクをクリックするが、「開く　＋」の表示がない（既に開いている）場合には、その操作をスキップするように変更した。

その後、「請求の範囲」と「詳細な説明」に対しても、「要約」に対して行ったのと同様の処理を行う。これによって、必要な情報が全て表示された状態となっているはずである。

６．固定URLを表示させ、表示内容をダウンロード

For Each wEle In Driver.FindElementsByTag(“a”)
If InStr(wEle.Text, “URL”) > 0 Then
wEle.Click
Exit For
End If
Next

Set wEle = Nothing

Dim Fname As String
Fname = “D:\” & patnum & “.txt”

Open Fname For Output As #1
Print #1, Driver.PageSource
Close #1

targetTitle = “簡易検索｜J-PlatPat [JPP]”
Driver.Close
Driver.SwitchToWindowByTitle (targetTitle)

前半では、全てのAタグの中から、URLボタンを探し、これをクリックして固定URLを表示させている。ここまでの操作により、オブジェクト変数 Driver に必要な情報がすべて取り込まれたので、Driver.PageSource をテキストファイルに書き込んでいる。さらにこのウィンドウをクローズしたのち、SwitchToWindowByTitleで、検索結果一覧表が表示されている最初のウィンドウに操作を移す。これで、上の「４．」に戻って、次の公報のリンクをクリックして詳細画面を開くといった一連の操作を継続することが可能となる。

沢木技術士事務所

Sawaki PE Jp Office – Think for the future –