zlhome.com Deal

zlhome.com Deal

using AnfleCrawler.Common;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;

namespace AnfleCrawler.DataAnalyzer
{
    internal class Zlhome : AnalyzerBase
    {
        protected override void AnalyzeInternal(PageLandEntity current)
        {
            var lander = Crawler.Lander;
            var pHandler = CreateContentHandler(current);
            switch (current.Depth)
            {
                case 0:
                    {
                        var dom = lander.GetDocument(pHandler);
                        DoPerPaging(current, dom.DocumentNode, ".page:first-child a:last-child");

                        foreach (var node in QueryNodes(dom.DocumentNode, ".xqlistBox .l_img a"))
                        {
                            var url = GetHref(node, current.Url);
                            Crawler.PushUrl(url, DataDepth.Houses);
                        }
                    }
                    break;
                case DataDepth.Houses:
                    {
                        var dom = lander.GetDocument(pHandler);
                        var attrs = new AttributeFiller();

                        attrs.Append("小区名称:{0}", QueryTexts(dom.DocumentNode, ".sc a").First().Replace("关注", string.Empty));

                        attrs.Append(QueryTexts(dom.DocumentNode, ".c:last-child li"));

                        Guid hashKey = GenHashKey(current.Url.OriginalString);
                        var bo = Crawler.Repository.LoadHouses(hashKey);
                        bo.SiteID = "Zlhome.com";
                        bo.PageUrl = current.Url.OriginalString;
                        bo.CityName = Crawler.Config.CityName;
                        attrs.FillEntity(bo, new Dictionary<string, string>()
                        {
                            {"地址", "小区地址"},
                            {"所属片区", "所属区域"},
                            {"物业类型", "物业类别"},
                            {"骏工日期", "竣工时间"},
                        });
                        MapMark(bo);
                        Repository.Save(bo);
                        Crawler.OutWrite("保存楼盘 {0}", bo.小区名称);

                        var pNode = QueryNodes(dom.DocumentNode, ".xqinfo").Skip(1).First();
                        var dealNode = QueryNode(pNode, "a");
                        var url = GetHref(dealNode, current.Url);
                        Crawler.PushUrl(url, DataDepth.Deal, bo.RowID);
                    }
                    break;
                case DataDepth.Deal:
                    {
                        Guid housesID = (Guid)current.State;
                        var dom = lander.GetDocument(pHandler);

                        bool isRent = false;
                        foreach (var table in QueryNodes(dom.DocumentNode, ".cjxxtable"))
                        {
                            foreach (var node in QueryNodes(table, "tr"))
                            {
                                var spans = QueryTexts(node, "td").ToArray();
                                DateTime? transactionDate = null;
                                DateTime dump;
                                if (DateTime.TryParse(spans[0], out dump))
                                {
                                    transactionDate = dump;
                                }
                                Repository.SaveHouselisting(new HouselistingEntity()
                                {
                                    HousesID = housesID,
                                    TransactionDate = transactionDate,
                                    Area = spans[1],
                                    Apartment = spans[3],
                                    Orientation = spans[4],
                                    Floor = spans[5],
                                    UnitPriceOrLease = spans[6],
                                    SoldPriceOrRent = spans[7],
                                    ServiceBroker = spans[8],
                                    IsRent = isRent
                                });
                                Crawler.OutWrite("保存小区{1}记录 {0}", housesID, isRent ? "出租" : "出售");
                            }
                            isRent = true;
                        }
                    }
                    break;
            }
        }
    }
}

 

posted on 2015-02-04 16:18 RockyLOMO 阅读(...) 评论(...) 编辑 收藏

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
电子图书资源服务系统是一款基于 Java Swing 的 C-S 应用,旨在提供电子图书资源一站式服务,可从系统提供的图书资源中直接检索资源并进行下载。.zip优质项目,资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松copy复刻,拿到资料包后可轻松复现出一样的项目。 本人系统开发经验充足,有任何使用问题欢迎随时与我联系,我会及时为你解惑,提供帮助。 【资源内容】:包含完整源码+工程文件+说明(若有),项目具体内容可查看下方的资源详情。 【附带帮助】: 若还需要相关开发工具、学习资料等,我会提供帮助,提供资料,鼓励学习进步。 【本人专注计算机领域】: 有任何使用问题欢迎随时与我联系,我会及时解答,第一时间为你提供帮助,CSDN博客端可私信,为你解惑,欢迎交流。 【适合场景】: 相关项目设计中,皆可应用在项目开发、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面中 可借鉴此优质项目实现复刻,也可以基于此项目进行扩展来开发出更多功能 【无积分此资源可联系获取】 # 注意 1. 本资源仅用于开源学习和技术交流。不可商用等,一切后果由使用者承担。 2. 部分字体以及插图等来自网络,若是侵权请联系删除。积分/付费仅作为资源整理辛苦费用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值