正規表現で台詞を抜き取る

Go Yoshiwara

Go Yoshiwara

ウェブ上にある台詞を抜き取ってみたかったので、正規表現の勉強がてらやってみました。

取りたいのは、「」で囲まれた任意の文字です。

$match = array();

$html = file_get_contents("任意のURL");

preg_match_all("/「(.+?)」/",$html,$match);

print_r($match);

今日新しく覚えたのが、file_get_contents()。

指定したURLのデータをテキストにして持ってきてくれるみたいです。

わーお、便利だな。

で、とってきたデータをpreg_match_all()で解析して、「」の中を取り出します。

指定したURLの中に複数の「」で囲まれた台詞があった場合、ひとつづつ配列に入れていきます。

これがpreg_match()だと、ひとつめの台詞を取った時点で終わります。

よく分からないパターンの書き方

今回は色々試行錯誤した結果、/「(.+?)」/っていうパターンで上手くいきました。

いやー この辺は実際まだよく分からない・・・。

勉強勉強と。

LIGはWebサイト制作を支援しています。ご興味のある方は事業ぺージをぜひご覧ください。

Webサイト制作の実績・料金を見る

この記事のシェア数

1982年生まれ。信濃中学校卒業。フリーターとして23歳まで様々な職業に従事し数々のスキルを身につける。ウェブデザイナーとして活躍したのち、25歳で起業し代表取締役に就任(会長を経て2022年に退任)。自然あふれる場所で生まれ、アウトドアスポーツをして育ったが故にITの道を志したが、近年、再びアウトドアな環境、遊び、生き方を模索して長野県に移住。わくわくするものをつくり続けていたい。

このメンバーの記事をもっと読む