以下是一个简单的PHP爬虫实例,它演示了如何从一个静态网页中抓取数据。这个实例将使用PHP的cURL库来发送HTTP请求,并解析返回的HTML内容。

实例:使用PHP从网站获取标题列表

1. 配置环境

确保你的PHP环境中已经安装了cURL扩展。

实例php 爬虫',实例PHP爬虫:如何从网站获取数据  第1张

2. PHP代码

```php

// 目标网站的URL

$url = 'http://example.com';

// 初始化cURL会话

$ch = curl_init($url);

// 设置cURL选项

curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

curl_setopt($ch, CURLOPT_HEADER, false);

// 执行cURL会话

$response = curl_exec($ch);

// 检查是否有错误发生

if (curl_errno($ch)) {

echo 'cURL error: ' . curl_error($ch);

exit;

}

// 关闭cURL会话

curl_close($ch);

// 使用DOMDocument解析HTML

$dom = new DOMDocument();

@$dom->loadHTML($response);

// 获取所有的标题元素

$titles = $dom->getElementsByTagName('h1');

// 创建一个数组来存储标题

$titlesArray = [];

// 遍历所有标题并添加到数组中

foreach ($titles as $title) {

$titlesArray[] = $title->nodeValue;

}

// 输出标题列表

echo "