本站业务范围:1、PC端软件开发、网站开发 2、移动端APP、网站、微信接口、微商城开发 3、视频教程、课程设计和辅导 4、单片机开发 5、串口通讯调试
 当前位置:文章中心 >> Winform/客户端程序
立即购买视频教程 c#数据采集之招聘网站信息实时查询
夜鹰教程网 来源:www.yyjcw.com 日期:2017-11-4 17:16:21
c#数据采集之招聘网站信息实时查询,c#数据采集。

这篇文章不能解决你的问题?我们还有相关视频教程云课堂 全套前端开发工程师培训课程

微信号:yyjcw10000 QQ:1416759661  远程协助需要加QQ!

业务范围:视频教程|程序开发|在线解答|Demo制作|远程调试| 点击查看相关的视频教程

技术范围:全端开发/前端开发/webapp/web服务/接口开发/单片机/C#/java/node/sql server/mysql/mongodb/android/。 



    效果图:

1.png

    第一、分析url
    智联招聘:
    猎聘网:
    前程无忧:
    第二、用到了HtmlAgilityPack.DLL ...
    1.设置访问url页面的编码
    2.元素路径下的元素集合
    3、取标签的属性值 Attributes
    4.取标签的中间的文本 InnerText
    5.过滤选择特定的id 或 class
    第三、浏览器滚动条的onscroll事件
    取窗口可视范围的高度[浏览器可见区域高度]
    取窗口滚动条高度[滚动条距离顶部的高度]
    取文档内容实际高度
    滚动条距离底部的高度

      最近听得较多的跳槽、面试之类的,相信很多园友也开始蠢蠢欲动了,有的甚至早已经开始了。最近我也在琢磨着换工作的事。说得俗套点,人在外面不就为了那么点工资么。现在找工作大部分都是通过在网上投简历,然后等电话 通知面试的。然,现在的招聘网站也是比较多。一个一个的在各大网站切换的流量招聘信息 实属麻烦。之前看到过一篇博文。《找工作神器,提取各大网站有效的招聘信息(前程无忧、智联招聘、猎聘网)》感觉这想法挺好的。把各大网站信息集中起来浏览,第一省了来回切换,第二还不容易重复投简历。本想拿来用用的,无奈没有提供源码下载,且是客户端版本。于是就只能自己动手,丰衣足食了~。(网站就是强大,可以大家一起分享●0●^_^)

     合并查询本来就是为了简单方便,所以也就没有弄很复杂了,一个页面搞定。如果同学们有什么好的想法,可以建议建议。
效果图:

就一个简单的关键字输入框、工作地点的选择和信息来源网站。

其实看上去很简单,实现起来也很简单。~~代码不多,难度也很小。很多时候需要的技术不是很多,想法更重要。

不想往下看的可以直接用用 演示地址 ,同学们求工作给推荐推荐,上海 浦东 .net。 私密我,或Q我。

 
第一、分析url

进入招聘网站的时候url大串大串的,我们需要用的的就三个。搜索关键字、地址和页码。
智联招聘:

http://sou.zhaopin.com/jobs/searchresult.ashx?jl=地址&kw=关键字&p=页码

jl=地址

kw=关键字

p=页码

然后地址的话 直接中文地址就ok了
猎聘网:

http://www.liepin.com/zhaopin/?key=关键字&dqs=地址&curPage=页码

key=关键字

dqs=地址

curPage=页码

地址有一个对应的编号

("北京", "010");
("上海", "020");
("广州", "050020");...等等  也是在猎聘网选择地址的地方右键 审查元素可以看到,如下:
前程无忧:

http://search.51job.com/jobsearch/search_result.php?jobarea=地址&keyword=关键字&curr_page=页码

jobarea=地址 [和猎聘一样的查找方法]

keyword=关键字

curr_page=页码
第二、用到了HtmlAgilityPack.DLL HTML解析组件

在之前我发过的 博客转发小工具 有提过HtmlAgilityPack。这里再简单的说说用法。
复制代码

2.png

case ZhaopinType.猎聘网:

    var htmlWeb = new HtmlWeb();
    htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");
    HtmlAgilityPack.HtmlDocument response = htmlWeb.Load(url);
    #region MyRegion
    var ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");
    foreach (var item in ulS)
    {
        var xpath = item.XPath;
        string titleName, infourl, company, city, date, salary, salary_em, source;
        titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;
        infourl = item.SelectSingleNode(xpath + "/a").Attributes["href"].Value;
        company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;
        city = item.SelectSingleNode(xpath + "/a/dl/dt[@class='city']/span").InnerText;
        date = item.SelectSingleNode(xpath + "/a/dl/dt[@class='date']/span").InnerText;
        salary = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/span").InnerText;
        salary_em = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/em").InnerText;
        source = "猎聘网";

        zpInfoList.Add(
            new ZhaopinInfo()
            {
                city = city,
                company = company,
                date = date,
                info_url = infourl,
                salary = salary,
                salary_em = salary_em,
                titleName = titleName,
                source = source
            });
    }
    #endregion
    break;

复制代码
1.设置访问url页面的编码

 htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");

设置编码为UTF-8,具体看对应页面采用的编码。
2.元素路径下的元素集合

var ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");

SelectNodes方法里面的这串字符串怎么来?

右键审查元素 Copy XPath 就ok了。不过如果js有动态修改document树的话 那么这个路径就不准了,需要自己微调下。
3、取标签的属性值 Attributes

如:取a标签的title值。

titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;
4.取标签的中间的文本 InnerText

company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;
5.过滤选择特定的id 或 class

XPath 中 标签名后面加上中括号 和@ 如: "/a/dl/dt[@class='company']"
第三、浏览器滚动条的onscroll事件

js获取滚动条距离浏览器顶部,底部的高度,兼容ie和firefox
取窗口可视范围的高度[浏览器可见区域高度]
复制代码

//取窗口可视范围的高度[浏览器可见区域高度]
        getClientHeight: function () {
            var clientHeight = 0;
            if (document.body.clientHeight && document.documentElement.clientHeight) {
                var clientHeight = (document.body.clientHeight < document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;
            } else {
                var clientHeight = (document.body.clientHeight > document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;
            }
            return clientHeight;
        }

复制代码
取窗口滚动条高度[滚动条距离顶部的高度]
复制代码

  getScrollTop: function () {
            var scrollTop = 0;
            if (document.documentElement && document.documentElement.scrollTop) {
                scrollTop = document.documentElement.scrollTop;
            } else if (document.body) {
                scrollTop = document.body.scrollTop;
            }
            return scrollTop;
        }

复制代码

 3.png

取文档内容实际高度


  getScrollHeight: function () {
            return Math.max(document.body.scrollHeight, document.documentElement.scrollHeight);
        }

 
滚动条距离底部的高度

getScrollbheight: function () { return this.getScrollHeight() - this.getScrollTop() - this.getClientHeight(); }

 

 取滚动条距离底部的高度,当滚动条到最底部的时候,通过ajax异步请求后台,加载下一页数据,这样就可以免了翻页的麻烦了。

 

ps:用jquery 更加简洁(感谢@Samguist)

if ($(window).scrollTop() == $(document).height() - $(window).height()) {
// ajax异步加载数据
}

 基本上就是这样简单,没什么难度。记得有什么好工作通知一声哦~^_^ ^_^   ***** 点击本人求职信息*****

环境:vs2013   数据库:无   插件:HtmlAgilityPack   演示地址  源码下载  (源码都下了 顺手点个赞呗~)
复制链接 网友评论 收藏本文 关闭此页
上一条: 微软提供的专门用于记录信息的Tra…  下一条: 设计模式汇总
夜鹰教程网成立于2008年,目前已经运营了将近 13 年,发布了大量关于 html5/css3/C#/asp.net/java/python/nodejs/mongodb/sql server/android/javascript/mysql/mvc/easyui/vue/echarts原创教程。 我们一直都在坚持的是:认证负责、一丝不苟、以工匠的精神来打磨每一套教程,让读者感受到作者的用心。我们默默投入的时间,确保每一套教程都是一件作品,而不是呆板的文字和视频! 目前我们推出在线辅导班试运营,模式为一对一辅导,教学工具为QQ。我们的辅导学科包括 java 、android原生开发、webapp开发、商城开发、C#和asp.net开发,winform和物联网开发、web前端开发,但不仅限于此。 普通班针对的是国内学员,例如想打好基础的大学生、想转行的有志青年、想深入学习的程序员、想开发软件的初学者或者业余爱好者等。 就业办针对即将毕业上岗的大四学生,或者打算转行的初级开发工程师。 留学生班针对的是在欧美、加拿大、澳洲、日本、韩国、新加坡等地留学的中国学子,目的是让大家熟练地掌握编程技能,按时完成老师布置的作业,并能顺利地通过考试。 详细咨询QQ:1416759661   夜鹰教程网  基于角色的权限管理系统(c-s/b-s)。
  夜鹰教程网  基于nodejs的聊天室开发视频教程
  夜鹰教程网  Git分布式版本管理视频教程
  夜鹰教程网  MVC+EasyUI视频教程
  夜鹰教程网  在线考试系统视频教程
  夜鹰教程网  MongoDB视频教程。
  夜鹰教程网 Canvas视频教程
  夜鹰教程网 报表开发视频教程
  推荐教程/优惠活动

  热门服务/教程目录

  夜鹰教程网  新手必看,详细又全面。
  夜鹰教程网  购买教程  夜鹰教程网  在线支付-方便
  夜鹰教程网  担保交易-快捷安全   夜鹰教程网  闪电发货
  夜鹰教程网  电话和QQ随时可以联系我们。
  夜鹰教程网 不会的功能都可以找我们,按工作量收费。

客服电话:153 9760 0032

购买教程QQ:1416759661  
  热点推荐
破解封路由的方法详解
技巧篇:只用这一招就能拒绝全部的…
挂马方法和技巧大汇总
网络安全防护:如何防止远程入侵
如何解决:系统开机就弹出广告网页…
彻底防御U盘病毒
安全配置交换机端口提高网络安全性…
浅析网络安全审计原理和技术(2)
用U盘就可以去除win XP管理员密码…
电脑硬盘各逻辑盘用鼠标左键双击它…
详解网站挂马的手段
新手认识;网银账号相关知识
ARP欺骗和ICMP欺骗催生全新DOS工具…
浅析网络安全审计原理和技术(1)
木马最基本的隐藏:不可见窗体和隐…
  尊贵服务
夜鹰教程网 承接业务:软件开发 网站开发 网页设计 .Net+C#+VS2008+MSsql+Jquery+ExtJs全套高清完整版视频教程
  最近更新
.NET C# 和Java开发人员岗位切换
模拟登录人人网
HttpWebRequest以及HttpWebRespon…
HttpClient使用说明
Winform为Combobox树添加数据
C#之允许DataGridView选中整行
C#中DataGridView只能选择一行禁止…
为自动填充列调整大小期间不能执行…
c# winform设置listBox如何设置te…
c#的委托(代理)和事件
C# Task 任务计划
C# socket 多线程多管道可断点传送…
让ListBox的滚动条滚动到最底部
c#用事件模式实现通知
什么是异步编程,为什么会需要异…
  工具下载  需要远程协助? 

sql2008视频教程 c#视频教程

VIP服务:如果您的某个功能不会做,可以加我们QQ,给你做DEMO!

JQUERY  Asp.net教程

MVC视频教程  vs2012
.NET+sql开发
手机:15397600032 C#视频教程下载
微信小程序 vue.js高级实例视频教程

教程咨询QQ:1416759661


这篇文章不能解决你的问题?我们还有相关视频教程云课堂 全套前端开发工程师培训课程

微信号:yyjcw10000 QQ:1416759661  远程协助需要加QQ!

业务范围:视频教程|程序开发|在线解答|Demo制作|远程调试| 点击查看相关的视频教程

技术范围:全端开发/前端开发/webapp/web服务/接口开发/单片机/C#/java/node/sql server/mysql/mongodb/android/。 



关于我们 | 购买教程 | 网站建设 | 技术辅导 | 常见问题 | 联系我们 | 友情链接

夜鹰教程网 版权所有 www.yyjcw.com All rights reserved 备案号:蜀ICP备08011740号3