by Hippo2000(2001/1/25)
HTML::HeadParserなのです。
なお内容等が間違っていたら修正します。ご連絡ください。
HTML::HeadParser - HTMLドキュメントの<HEAD>セクションを解析する
require HTML::HeadParser; $p = HTML::HeadParser->new; $p->parse($text) and print "not finished";
$p->header('Title') # <title>....</title>にアクセスする
$p->header('Content-Base') # <base href="http://...";>にアクセスする
$p->header('Foo') # <meta http-equiv="Foo" content="...">にアクセスする
HTML::HeadParser は特殊化された(そして軽量な) HTML::Parser です。それはHTMLドキュメントの<HEAD>...</HEAD> 部分だけを解析します。parse()メソッドは<BODY>要素また本文が見つかるとすぐにFALSEを返します。そしてこの後は再び呼び出すべきではありません。
HTML::HeadParser はヘッダ・オブジェクトへのリファレンスを保持し、パーサーはそのHTMLドキュメントで理解されたいくつかの<HEAD>セクションの要素と同じである、このヘッダ・オブジェクトを更新します。以下のヘッダフィールドが影響を受けます:
(上位クラスによって提供されているものに加えて)以下のメソッドが利用できます。
$h = HTTP::Headers->;new; $p = HTML::HeadParser->new($h); $p->parse(<<EOT); <title>Stupid example</title> <base href="http://www.sn.no/libwww-perl/";> Normal text starts here. EOT undef $p; print $h->title; # "Stupid example"となるはず
HTTP::Headers クラスはlibwww-perl の一部として配布されています。
(原文のまま)
Copyright 1996-1999 Gisle Aas. All rights reserved.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.
ご意見、ご質問はこちらの掲示板で受け付けています。
またメールは河馬屋(Nifty)にお願いします。