DedeCMS采集教程:过滤替换的技巧_DedeCms教程
教程Tag:暂无Tag,欢迎添加,赚取U币!
DedeCMS采集教程:过滤替换的技巧
根据我个人织梦dedecms采集过程总结了一些经验,写出来供大家参考。
根据我个人织梦dedecms采集过程总结了一些经验,写出来供大家参考。
1.采集去除链接
- [Copy to clipboard]CODE:
- {dede:trim}]*)>([^<]*){/dede:trim}
- --------------------------------
- 让field:title 标题突破30这个长度,修改代码的方法
- 找到./include/inc_arcpart_view.php
- 行291 :
- if($titlelen=="") $titlelen = 30;
- 修改为
- if($titlelen=="") $titlelen = 60;
- 就可以了,然后,你可以这样调用了
- {dede:channelArtlist typeid='0' col=1 tablewidth='100%'}
- {dede:arclist row="10"}
- [field:title function="cn_substr('@me',38)" /]
- {/dede:arclist}
- {/dede:channelArtlist}
- 把这个延伸一下:关于inc_arcpart_view.php
- function GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160,
- $imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword="",
- $innertext="",$tablewidth="100",$arcid=0,$idlist="")
这里的参数都可以更改你实际需要的模板元素尺寸大小.
2. 采集过虑中去掉链接保留文字的方法!
柏老大的方法是{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}
这样做会去掉<a hf.......>与</a>之间的字符!这样整个文章就少了部分字符,不完整了!
后来我多次测试,总算找到了正确的使用方法!如下:
- {dede:trim}<a([^>]*)>{/dede:trim}
- {dede:trim}</a>{/dede:trim}
- 做成两条采集规则就可以了!
- 在实际使用中好像([^<]*)([^>]*)两条一起使用才行!
3. 过滤div
- {dede:trim}]*)>{/dede:trim}
- {dede:trim}
- {/dede:trim}
- 过滤js
- {dede:trim}]*)>([^<]*){/dede:trim}
- 过滤未知变量字符
- 固定(.*)固定
4.dede万能过滤代码
以下是常用的正则表达式标签
- {dede:trim}<tbody(.*)>{/dede:trim}
- {dede:trim}</tbody>{/dede:trim}
- {dede:trim}<table(.*)>{/dede:trim}
- {dede:trim}</table>{/dede:trim}
- {dede:trim}<tr(.*)>{/dede:trim}
- {dede:trim}</tr>{/dede:trim}
- {dede:trim}<td(.*)>{/dede:trim}
- {dede:trim}</td>{/dede:trim}
- {dede:trim}<font(.*)>{/dede:trim}
- {dede:trim}</font>{/dede:trim}
- {dede:trim}<a(.*)>{/dede:trim}
- {dede:trim}</a>{/dede:trim}
- {dede:trim}<param(.*)>{/dede:trim}
- {dede:trim}<embed(.*)</embed>{/dede:trim}
- {dede:trim}<object(.*)</object>{/dede:trim}
- {dede:trim}<iframe(.*)</iframe>{/dede:trim}
- {dede:trim}<form(.*)</form>{/dede:trim}
- {dede:trim}<input(.*)>{/dede:trim}
- {dede:trim}<script(.*)</script>{/dede:trim}
- {dede:trim}<style(.*)</style>{/dede:trim}
- {dede:trim}<!--(.*)-->{/dede:trim}
- 以下为不常用的正则表达式标签
- {dede:trim}<div(.*)>{/dede:trim}
- {dede:trim}</div>{/dede:trim}
- {dede:trim}<center(.*)>{/dede:trim}
- {dede:trim}</center>{/dede:trim}
- {dede:trim}<p(.*)>{/dede:trim}
- {dede:trim}</p>{/dede:trim}
- {dede:trim}<span(.*)>{dede:trim}
- {dede:trim}</span>{dede:trim}
- {dede:trim}<img(.*)>{/dede:trim}
以上内容仅供大家学习参考,希望对你有所帮助。
相关DedeCms教程:
- DedeCMS系统参数设置手册之互动设置 相关案例演示
- 织梦dedeCMS文章防刷新机制的代码
- 织梦CMS实现软件及分类信息采集的方法
- 如何实现织梦dedecms会员登陆后就不显示广告
- 搜索框里显示字段鼠标点击后就隐藏的方法
- dedecms下广告延时加载显示,大大提高网页访问的速度
- DEDECMS复制文章带本站链接代码实例
- 织梦(dedecms)优化之更改RSS、sitemap路径至根目录
- 织梦DEDECMS5.7相关文章的调用问题
- 织梦删掉会员空间,保留开放会员(禁止注册)的方法
- 织梦dedecms channelartlist下autoindex失效解决办法
- Dedecms 自定义表单提交后自动发送表单数据到指定邮箱的思路