PHP去除采集文章内容中的图片及script标签和内容
展开阅读全文

今天查看采集文章的时候,发现采集的内容包含了script下的js文件内容,但是我用了php的自带函数:strip_tags

应该是会清除掉的呀,结果才发现这个strip_tags是有BUG的,他是会去除标签,但是不会清除某些标签下的内容,完撸子耶。最后我才想用正则来解决它。

解决方法:

$content = "这是一个好用的在线工具<img href='http://www.sts.js' alt='xx' >,解决时间问题<script src='wwww.lmcjl.com/lmcjl.js'>lmcjl在线工具</script>站长工具";
$content = preg_replace("#(<img(.*?)/?>|<script(.*?)>(.*?)</script>)#i","",$content);
echo $content;//这是一个好用的在线工具,解决时间问题站长工具