■概要

入力されたWebページからメールアドレスを抽出しメモ帳に記入します。

 

■プロセス

Main

04 - Extract Emails from a Web Page

 

<2行目>

「Display Input Dialog」アクションでユーザにURLの入力を促すダイアログを表示し、入力されたURLを%WebsiteSelected%変数に設定します。

 

<5行目>

「Run Function」アクションで”Download.Webpage.Text”ファンクションを起動します。

 

<6行目>

「Run Function」アクションで”Parse Emails”ファンクションを起動します。

 

<7行目>

「Run Function」アクションで”Write.Parsed.Emails”ファンクションを起動します。

 

<8行目>

「Run Application」アクションでメモ帳を起動し、一時ファイル(%TempFile%)を開きます。

※%TempFile%変数はMainファンクションでは出てきませんが、他のファンクションで設定されます。

 

Download.Webpage.Text 

04 - Extract Emails from a Web Page-2

 

<2行目>

「Download from Web」アクションで入力されたURL(%WebsiteSelected%)からHTMLテキストをダウンロードし%WebsiteText%変数に設定します。

 

Parse.Emails

04 - Extract Emails from a Web Page-3

 

<2行目>

「Parse Text」アクションでWebサイトのHTMLテキスト(%WebsiteText%)の先頭からメールアドレスを正規表現で検索し、見つかった全てのメールアドレスを%EmailsFound%変数に設定します。

「Parse Text」アクションの”Is Regular Expression”にチェックを付け、”Text to Find:”に正規表現の文字列を記述することで正規表現で検索できます。

今回の場合、正規表現の文字列としてメールアドレスを表現する以下の文字列を設定します。

“([a-zA-Z0-9_\-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([a-zA-Z0-9\-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})”

 

Write Parsed.Emails

04 - Extract Emails from a Web Page-4

 

<2行目>

「Get Temporary File」アクションで一時ファイルを作成し、そのファイルのパスを%TempFile%変数に設定します。

 

<3行目>

「For Each」アクションで見つかったメールアドレス(%EmailsFound%)の数だけ4行目を繰り返し処理します。

繰り返しごとに%EmailsFound%内の1つのメールアドレスを%CurrentEmail%変数に設定します。

 

<4行目>

「Write to Text File」アクションで一時ファイル(%TempFile%)にメールアドレス(%CurrentEmail%)を書き込みます。

 

このプロセスでは4つのファンクションを使っていますが、全ての処理をMainファンクションに記述することもできます。

しかし「WebサイトからHTMLテキストをダウンロードする処理」「テキストからメールアドレスを抽出する処理」「List型変数の内容を一時ファイルに書き込む処理」はそれぞれ独立しており、ファンクションにすることで使いまわしできる部品になることがメリットです。