在PHP中,如果我们要从文本中获取纯文本内容,而不想要HTML标记、实体以及其他标记的干扰,那么我们可以使用函数去掉html标签和实体,最终得到纯净的文本内容。
HTML标签和实体的存在,对于我们要处理的文本内容来说,是一种干扰。它们会使得我们处理文本内容的难度增加,降低处理的效率,因此,需要对它们进行过滤和处理。
在PHP中处理HTML标记和实体,可以使用strip_tags()函数和html_entity_decode()函数。
strip_tags()函数的作用是去掉字符串中的HTML和PHP标记。可以通过设置第二个参数来保留一些标记,不被去掉。
下面是strip_tags()函数的基本用法:
1
2
$text = <h1>这是一个标题</h1><p>这是一段正文 &其他标记</p>;
echo strip_tags($text);
输出结果为:
1
这是一个标题这是一段正文& 其他标记
可以看到,原字符串中的HTML标记和实体都被去掉了。
如果我们想要保留一些HTML标记,可以将这些标记作为第二个参数传递给strip_tags()函数。比如,下面的代码保留了b和i标记:
1
2
$text = <b>加粗</b>文字<i>倾斜</i>等其他标记;
echo strip_tags($text, <b><i>);
输出结果为:
1
<b>加粗</b>文字<i>倾斜</i>等其他标记
可以看到,b和i标记被保留了,其他标记都被去掉了。
接下来,我们再来看一下html_entity_decode()函数,这个函数的作用是将HTML实体转换为它们对应的字符。
下面是html_entity_decode()函数的基本用法:
1
2
$text = HTML 实体 &<>©;
echo html_entity_decode($text);
输出结果为:
1
HTML 实体 &<>©
可以看到,实体被转换成了它们对应的字符。
结合strip_tags()和html_entity_decode()两个函数的作用,我们可以得到纯净的文本内容,如下所示:
1
2
3
$text = <h1>这是一个标题</h1><p>这是一段正文 &其他标记</p>;
$text = strip_tags($text); // 去掉HTML标记
$text = html_entity_decode($text); // 转换HTML实体
最后,得到的$text就是纯净的文本内容。
综上所述,利用strip_tags()和html_entity_decode()函数,我们可以很方便地去掉HTML标记和实体,得到纯净的文本内容。在处理文本时,这两个函数是非常有用的工具。
以上就是php如何去掉html标签 nbsp的详细内容,更多请关注php中文网其它相关文章!
2. 分享目的仅供大家学习和交流,请不要用于商业用途!
3. 如果你也有好源码或者教程,可以到用户中心发布投稿,分享有佣金分成!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务 请大家谅解!
5. 如有链接无法下载、失效或广告,请联系站长,可领回失去的金币,并额外有奖!
6. 如遇到加密压缩包,默认解压密码为"www.77ym.top",如遇到无法解压的请联系管理员!
7. 本站部分文章、资源来自互联网,版权归原作者及网站所有,如果侵犯了您的权利,请及时联系我站删除。免责声明
暂无评论内容