J-PlatPatからテキスト版特許公報をダウンロードするツール

今まで、特許関連のツールとして、PKM(特許公報をダウンロードし、複数のキーワードを色分け表示するツール)とGPD(世界各国のPDF版特許公報を一括ダウンロードするツール)を作成し、機能限定版を公開してきた。

どちらも、Google Patents にアクセスし、テキスト版公報やPDF版公報をダウンロードするものである。何故、Google Patents かというと、世界各国の特許公報が多量に収録されていることや、どこの国の特許も英語に機械翻訳されているので、いろいろな国の特許を便利に解析することができることなどのメリットがあるためではあるが、もう1つ非常に重要な利点として、公報番号がわかると、公報が掲載されているサイトのURLがほぼ推定でき、しかも、そのURLで表示されるページ1つにほぼ全ての情報がまとめて掲載されていることが挙げられる。

一方で、例えば最新の日本公開公報が収録されるまでのタイムラグが大きいとか、比較的古い公報が収録されていない、といったことが、Google Patents の欠点として挙げられる。

これに対し、独立行政法人 工業所有権情報・研修館(INPIT)が運営している特許情報プラットフォーム(J-PlatPat)の場合、非常に古い公報から最新の公報まで全て収録されている点では完璧ではあるが、公報番号がわかっていてもその公報が掲載されているページのURLを推定することはできないし、公報内容を表示させるためには、検索ページに公報番号を入力し、検索ボタンをクリックし、表示される検索結果一覧から所望の公報のリンクをクリックし、これにより新たに表示されるウィンドウで、「要約」「請求の範囲」「詳細な説明」のそれぞれのリンクをクリックする必要がある、というとても面倒な仕様となっている。そのため、エクセルを自動操作して公報内容をダウンロードするためには、単に特定のURLにアクセスして内容をダウンロードするといった操作ではなく、公報番号の入力や、いくつかのリンクを探してクリックするといった、ややこしい操作を連続して行う必要がある。

とはいえ、実際にPKMを仕事に使用していると、最新の日本特許公報がGoogle Patentsには収録されていないことがネックとなることも多く、何とかJ-PlatPatから公報をダウンロードできないものか、いろいろと考えてみたが、かなりハードルが高そうなので、あきらめていた。

今般、新型コロナウイルスの影響で、ステイホーム週間となり、家でPCに向かう時間も増えたので、この機会にJ-PlatPatからの公報データ取得に挑戦することにした。ネットを色々と調べてみると、指定したURLのサイトにアクセスし、特定のテキストボックスにデータを入力したり、特定のボタンやリンクをクリックしたり、表示される内容をダウンロードしたり、といった基本的な操作は、全てMicrosof ExcelのVBA(マクロ)で実現可能であることがわかったので、あとは実際にこれらの操作を組み合わせて、思い通りに動作するか試してみるだけである。

しかし、実際に動かしてみると、多くの操作は必ずしも思うように動作せず、参考になりそうなサイトの記載通りにしても意図したように動かなかったり、どうしてよいものか途方に暮れるような事態も多々起こり、結構大変であった。それでも何とか1つずつ、問題を解決し、どうにか全ての操作を一通り実施して、所望のデータをダウンロードできるようになった。

とはいうものの、サイトの応答が極端に遅くなるとエラーが発生したり、データを取りこぼしたりといった問題が頻発したため、要所要所に何秒間かの待ち時間を設定してみたり、何度か同じ操作をループさせてみたり、といった工夫をしたのだが、それだけではうまくいかず、さらに試行錯誤を続けることで、少しはサイト側の応答を待つコツをつかんだようで、当初よりもかなりスムーズかつ迅速に動作するところまで来た。

この辺の、さまざまな問題点やその解決方法については、ネット上には掲載されていないものもあり、もしかしたら他の方のお役に立つこともあるかもしれないので、備忘録を兼ねて、今後何回かに分けて、ここに記載したいと思う。

—————————————————

というわけで、とりあえずの完成版を「J-PlatPat Downloader (JPPD)」と名付け、無料のお試し版を公開しました。よろしかったら、試しに使ってみてください。エラー対応などは不完全な状態ですが、何とか試用に耐えるレベルには仕上がっているかと思いますが、J-PlatPatのサイトが非常に重たい時間帯は避けた方が無難だと思います。

J-PlatPat Downloader (JPPD) のページへ

ご意見やご要望があれば、遠慮なくお願いします。可能な限り、対応させていただきます。

Windows7からWindows10への無償アップグレードに成功

現在、PCを数台保有しているが、内1台はOSがWindows7のままであった。Windows7は2020年1月でサポート対象外になるということで、そろそろ何か手を打たなくては、と考えていたのだが、ちょっと調べてみると、Windows10へのアップグレードは、1万数千円でライセンスを購入する必要がありそうだ。(例えば、https://pc-hikkoshi.com/upgrade/windows10-04.html

Windows10が出た当初、Windows7やWindows8からWindows10に無償アップグレードができるキャンペーンがあったが、その期間内にアップグレードしなかった場合、今では有償でしかアップグレードできない、ということのようだ。

ところが、今でも無償でアップグレードできますよ、という情報もチラホラ見つかる(例えば、https://applica.info/windows10-upgradehttps://hackers-high.com/windows/upgrade-windows10-for-free/、など)。そこで、駄目元で無償アップグレードに挑戦してみた。方法は、マイクロソフトの公式ページでツールをダウンロードして、あとはそのツールを起動して、画面の指示に従うだけだ。
https://www.microsoft.com/ja-jp/software-download/windows10

ライセンス認証の際に、元々のWindows7のライセンスキーとか、Microsoftのアカウントやパスワードが必要になるかと思って、メモしておいたけど、結局、何もそんな手続きなしに、あっさりとアップグレードできてしまった。

Windows7で使っていた設定、アプリなどが、ほぼそのまま引き継がれたので、アップグレード後も、ごちゃごちゃとしたインストール作業や設定作業などほとんど必要なく、すぐに使用可能となるのもありがたい。(ついでにマイクロソフトオフィスも最新型にアップグレードされないかな、という淡い期待もあったが、さすがにそんなに甘くはないようで、Officeは従来のバージョンのままでした)

とはいえ、これで古いPCが1台、しばらく延命されることになった。何故、無償でアップグレードできたのか、何故、マイクロソフトはそのことを大々的にアナウンスしないのか、色々と不思議ではあるけれど、ともかくも、無事にあっさりとアップグレードできて何より。

ちなみに、今回無償アップグレードに成功したPCは、購入時にWindows7がインストールされていたノートPCで、Windows10への無償アップグレードキャンペーン期間には、アップグレードせずに、そのままWindows7として使い続けたもの。しかも、昨年(2018年5月)ハードディスク(本当はSSD)が突然死したため、全く起動できなくなり、メーカに送って、SSDを交換し、購入当初の状態になって戻ってきたものである。

もしも、これを読んだ方が同様の方法で無償アップグレードにチャレンジして、うまくいかなかったとしても、こちらとしては責任を負えませんので、あしからず。

 

その後、少し調べてみると、マイクロソフトは公式には、「”Windows 10 を入手” (GWX) アプリによる Windows 10 の無償アップグレードは、2016 年 7 月 29 日に終了しました。」と回答している(https://support.microsoft.com/ja-jp/help/12435/windows-10-upgrade-faq)。しかし、それはあくまでも Microsoft Update 経由でのアップグレードサービスが終了しただけで、必ずしも無償アップグレードができないということではないようだ(参考:https://otona-life.com/2019/08/05/18372/ など)。であれば、何故、Windows7からWindows10へのアップグレードパッケージが有償で売られているのかとか、もっと大々的にアナウンスすべきではないか、などモヤモヤしないでもないが、まあ、いいか。。

Google Patentsから世界各国のPDF版特許公報を一括ダウンロードするツール

最近、特許庁の特許情報プラットフォーム(J-PlatPat)がリニューアルされましたが、PDF版の特許公報をダウンロードする際の認証が厳しくなったようで、「私はロボットではありません」のチェックが必要であるばかりか、複数の公報を続けてダウンロードしようとすると、多数の写真が表示されて、質問に答えなくてはならなくなってしまいました。キーワード検索等で、複数の特許をまとめてダウンロードしたいときなど、ちょっと勘弁して欲しい仕様です。

有料の特許DBを利用できる場合には、特に問題ないのでしょうが、そうでない場合、何か方法はないものかと考えて、たどりついたのが、Google Patentsです。Googleは、特許情報の収録にも非常に意欲的で、最近は、非常に多くの国々の特許を収録しており、さらにはPDF版の公報の収録数もどんどん増えているようです。以前は、USとWOぐらいしかPDF版公報は収録されていなかったのですが、現時点では、これらに加え、JP, EP, CNなど、多くの国の特許が収録されています。

幸い、既にGoogle Patentsからテキスト版公報をダウンロードして、指定したキーワードをハイライト表示するツール(PKM)をエクセルのマクロ(VBA)を使用して作成済みだったので、これをベースに、日本および海外のPDF版特許公報をまとめて一括ダウンロードするツールをVBAで作成してみました。PKMでは、PDF版公報のURLの抽出まで行っていたので、今回のツールは特に問題なく、簡単に作成できました。

ということで、このツールの機能制限付きのお試し版を無料公開します(一度にダウンロードできる公報を20件に制限していますが、20件ずつ何度でも繰り返しダウンロードが可能です)。Google Patents にPDF公報が収録されていれば、日本はもちろん、世界各国の特許をまとめてダウンロードしてくれると思います。結構お役に立てるのではないでしょうか?

Google Patents Downloader (GPD) のページへ

Google Patentsは、時々大規模な改修が行われることがあり、そうなるとそれに対応した改訂が必要となりますが、必ずしも即時対応可能とは断言できかねます。

ご意見やご要望があれば、遠慮なくお願いします。可能な限り、対応させていただきます。

式量(分子量など)を計算するエクセルマクロ

今年は、国際周期表年(2019)ということで、これを記念して、最新の原子量に基づいて分子量を計算するツールを作成し、公開することにしました。(ウソ、後付けの理由です)

実は、久々に、色んな化合物の分子量や、その元素割合を計算する必要がありました。そこで、今から25年ほど前に、Visual Basicで作ったソフト(MOLWT)を使って計算してみました。何分、Windows3.1 ~ Windows95 の時代に作ったソフトですから、今動かそうとすると、分子量計算と元素割合計算程度ならできるものの、不具合も多く、手直ししたくとも、既に当時のVisual Basicが動く環境もなしという状況です。

とはいえ、Visual Basic は、今のエクセルなどのマクロ言語(VBA)とほとんど一緒なので、入出力関係や、イベントの取り扱いなど、インタフェース関係は大きく異なるものの、分子量を計算させる部分は、多分ほとんどそのまま使えるだろうと考え、エクセルで分子量計算させるマクロを作ってみることにしました。

何せ25年も前に作ったソフト、たかが分子量計算と侮るなかれ、入力された英数記号交じりの文字列を判読し、含まれる元素の数を計算して足し合わせるという操作を、ゼロから作るのは結構大変です。特に、入力式に括弧が含まれたり、原子や分子の係数に小数や分数の入力を許容すると、分子量計算の主要部分だけでも相当に複雑になります。

おまけに、これは半分遊びの要素なのですが、入力式は、元素記号の大文字小文字を区別せずに入力可能としています。化学式の入力の際に、元素記号を大文字・小文字を使い分けてキーボードで入力するのは、意外と面倒くさくないですか? そんな面倒な区別はせずに、”caso4″ とか、”al(po4)3″ などと入力するだけで、計算してくれるのは結構便利だと思いませんか。

でも、そうすると、例えば “co” という入力式が、”CO”(一酸化炭素)と”Co”(コバルト)の2種類の解釈が可能となるように、入力式のアルファベットを1文字ずつ、大文字か小文字かの2通りとして網羅的に探索することになり、その計算は結構大変です。

もっとも、そのおかげで、例えば “america”、”china”、”france”、”spain”、”nippon” などと入力して分子量を計算させてみると、

AmErICa: 577.24
CHINa: 162.91
FRaNCe: 399.12
SPaIn: 377.92, SPaIN: 404.01
NiPPoN: 313.67, NiPPON: 150.65, NIPPoN: 395.89, NIPPON: 232.87

などという結果が得られ、やっぱりアメリカの勝ち?となりました。(それがどうした?)

何せ25年も前に作ったプログラムのため、中を見ても、ほとんどチンプンカンプンで、中のロジックや個々の変数の役割など、かなり複雑で、これ本当にオレが作ったのか?状態で、到底隅々まで理解できてはいません。それでも、個々の機能がプロシージャやファンクションとして固まりになっているおかげで、その中身は良くわからなくても、とりあえずそれらしい答えは出るようになりました。うーん、もしかして25年前の自分は結構優秀だったのではないか、と思わなくもありませんが、いまさらどうしようもありませんね。

多分、正しい答えが出てくると思いますが、非常に複雑な入力式の場合には、おかしな動きをする可能性もありますので、出てくる答えを過信しないでください。

というわけで、とりあえずの完成版を「Molwt (Molecular Weight Calculator)」と名付け、無料公開しました。よろしかったら、試しに使ってみてください。エラー対応などは不完全な状態ですが、PCが固まったりはしないと思います。多少変な動作があってもご容赦ください。

Molwt のページへ

ご意見やご要望があれば、遠慮なくお願いします。可能な限り、対応させていただきます。

特許文献をダウンロードし、複数のキーワードを色分け表示するツール

仕事上、特許調査に関わることが多い。いろいろと工夫して、できるだけノイズと漏れが共に少ない検索を目指すものの、どうしても漏れを少なくしようと思うと、多少のノイズの混入は避けられない。そのため、特許調査で出てきた大量の特許文献リストに目を通し、明らかなノイズを除去したり、特に重要な特許にチェックを入れたりする作業が欠かせない。この作業は、特許文献1つ1つに目を通す必要があり、数が多くなると結構大変な作業となる。

実際に作業を行う際には、特許文献(公開公報や登録公報)中に、いくつかの所定のキーワードが含まれているかどうかを確認することが多い。日本語特許であればJ-PlatPat、海外特許であればEspacenetなどのサイトで、特許文献のテキスト版にアクセスし、ブラウザのページ検索機能(CTRL+F)を使って、特定のキーワードをハイライト表示させるとか、PDF公報にアクセスし、PDFリーダーのワード検索機能を使用したりすることになる。

しかし、これは非常に手間のかかる作業である。まずは目的の公報(特許文献)にアクセスするのに手間がかかる。なぜなら、J-PlatPatやEspacenetでは、各公報に直接アクセスされることを嫌っており、公報にたどり着くまでに何回かのクリックを必要とするからである。

さらに、目的の公報を開いた状態でも、複数のキーワードをそれぞれハイライト表示させるようなことは難しい。(J-PlatPatの場合には、複数のキーワードを入れて検索し、検索結果を表示させると、複数のキーワードがそれぞれ色分け表示されるけれど)また、特許毎に使用される用語が微妙に異なっていたり、表記揺れがあったり、同義語があったりするので、それへの対応も必要となる。例えば、「電池」と「バッテリー」とか、元素の場合には元素記号表記と元素名表記とか。。。

ということで、検索で出てきた大量の特許文献リストに対し、テキスト形式の特許文献を入手(ダウンロード)し、そのテキストに指定したキーワードが含まれていたら、その数をカウントすると同時に、キーワードの背景に色を付けてマーキング(ハイライト表示)するツールを作ってみることにした。処理にはエクセルのマクロ(VBA)を使うことにした。

特許文献リストの入手には、Google Patentsを使用した。最近のGoogle Patentsは優秀で、US、EP、WOなどに加え、JP、CN、KR、RUなどが、かなり新しいものも収録されている。しかも、これらは固定URLが与えられているので、公報番号がわかれば、直接アクセス可能である。さらに、素晴らしいのは、英語以外の文献の多く(ほとんどすべて?)は、Google得意の翻訳機能で、予め英語に翻訳されている(公報URLの末尾に”/en”を付けると、英語版が入手できる)。従って、全部を英語版で入手すれば、日本語の特許も中国語の特許も英語の特許もドイツ語の特許も、全部英語で解析することができる。もちろん、それぞれのオリジナル言語での解析も可能なので、日本語特許は日本語で解析することもできる。

※ 2019/4/1追記
Google Patentsは、今年の2月頃から、対応国・機関が大幅に増えており、現在は101カ国・機関となっている。ただし全ての国の全ての特許が収録されているわけではなく、ごく一部の特許だけが収録されている国もあるようだ。でも、今後充実していく方向にあるのは間違いないだろう。

テキスト版公報が入手できれば、あとは、公報の構成を理解し、タイトル、出願人、発明者、アブストラクト、クレーム、詳細な説明、などのそれぞれのブロックを認識し、指定したキーワードを探し出し、その数を数えると共に、キーワード部分の背景の色を変える処理をするだけなので、最初はちょっと苦労するけど、さほどややこしい処理でもないし、試行錯誤を何度か繰り返すうちに、それらしいものが出来上がった。

なお、キーワードはあらかじめ複数指定可能とし、1種類のキーワードについて複数の表記(同義語、表記揺れ、大文字・小文字など)を事前に登録する形式とした。

実際に出来上がったツールを使ってみると、これは非常に便利で、従来、時間と手間の掛かっていた処理がほぼ全自動となり、ノイズの除去や、重要特許の内容の把握などが短時間に可能となった。これは余りにも便利なので、多くの人にも知ってもらおうと思い、公開することにした。

—————————————————

というわけで、とりあえずの完成版を「Patent Keyword Marker (PKM)」と名付け、無料のお試し版を公開しました。よろしかったら、試しに使ってみてください。エラー対応などは不完全な状態ですが、PCが固まったりはしないと思います。多少変な動作があってもご容赦ください。なお、Google Patents の仕様等の変更への対応や、PKM自身の機能向上やバグ修正等を目的として、少しずつバージョンアップを続けています。

Patent Keyword Marker (PKM) のページへ

また、Google Patentsは、時々大規模な改修が行われることがあり、そうなるとそれに対応した改訂が必要となりますが、必ずしも即時対応可能とは断言できかねます。

ご意見やご要望があれば、遠慮なくお願いします。可能な限り、対応させていただきます。