网络爬虫”——财务和老板都害怕的事情终于来了!

  税务稽查网络种植的爬虫已经开始按照税务稽查制定的方向抓取风险企业疑点,效果达到了预期的要求。企业老总和财务人员担忧的事情终于在大数据时代进入了企业这是税务机关监控和征收管理的又一把利剑,它就是税务稽查监控网络体系中种植的“爬虫”。

  税务稽查在纳税评估的基础上开发的网络爬虫(又被称为网页蜘蛛,网络机器人、网页追逐者),其功能就是按照一定的规则和分析目的,自动地抓取互联网+税收的程序或者脚本,以此获取纳税人经营活动的信息,作为验证纳税人法律遵从度和申报的真实性。

  税务稽查网络爬虫强大的功能就在于它完全是按照税务稽查所下达查验的方向指令进行行动,这些爬虫可以很快的按照税务稽查的要求抓取到税务稽查人员所要的分析结果和反映出纳税人涉税异常点。

  一是拓展信息渠道,将网络爬虫技术引入涉税信息的采集,对外部网站披露的与企业资本运作活动有关的信息适时捕捉,丰富案源线索;

  二是精准工作定位,将风险方向定位在股权投资和土地、房屋等大额资产的处置上,分析方法和指标设计针对性强;(今后会快速延伸到其它环节)

  三是融合多方信息,引入了税务登记、申报、鉴证报告、财务报表、地税印花税等多方信息作为信息分析的主要着力点;

  四是强化信息的挖掘应用,软件着重建立了各类信息源之间的对应关系和勾稽关系,用以支持风险的推定和排查;

  五是风险信息重构,对多个投资方信息进行整理归纳,形成控制关系网络架构图,将复杂的资本运作行为重构还原为清晰的交易轨迹,以准确定位和发现这些交易中的税收风险。

  福州市国税局依靠“网络爬虫”技术自主研发了互联网涉税信息监控平台,实现了对上市公司股权交易等信息的实时精准掌控,突破了收集上市公司股权转让、股票减持信息难,导致税收征管不到位的瓶颈问题。

  不久前,福州两位税务干部“突降”某上市公司,企业财务经理吃了一惊:“公司董事会转让股权的公告昨晚才发布,国税局怎么这么快就知道了?”税务干部说,第一时间给他们“透露”消息的不是哪个人,而是“网络爬虫”。

  福州市国税局总经济师李建乐介绍说,他们的涉税信息监控平台具有三个突出的特点:分类抓取、实时监控和智能比对。平台主要从证券财经网站,重点抓取上市公司公告、上市公司十大股东股票减持、限售股解禁等信息;风控中心的专用电脑全天候实时抓取、储存和分类整理相关信息;平台将从互联网获取的信息与税收征管系统以及其他第三方信息进行自动比对,从中筛选出存在税收风险的管征户信息。

  记者日前来到福州市国税局,了解涉税信息监控平台的运行方式。进入系统后,先连接互联网的风控中心电脑,通过“网络爬虫”程序定向抓取各网站上发布的上市公司公告信息,并且将这些信息转化成可识别的文本。在当天股市收盘后,扫描程序开始启动,扫描“网络爬虫”抓取的公告内容。如果扫描中出现了福州市国税局管理的企业名称或者是其他有效信息,监控平台会自动将公告与福州市国税局管理企业建立起关联,并且以不同颜色的字体和高亮方式显示在电脑屏幕上。风控中心人员可以实时看到关联信息。

  对于互联网涉税信息监控平台抓取的信息,福州市国税局风控中心由专人盯守,一旦发现关联企业减持股票涉及税款问题,立即通知管征局到企业去调查核实,督促企业及时缴纳税款。今年5月,风控中心监控到福州一家上市公司减持股票,涉及金额1亿多元。税务干部马上赶到,向企业提示税收风险,企业当即缴纳1000多万元税款。

  另外,福州市国税局通过对监控平台抓取的信息,与税收征管信息系统信息进行比对分析,找出存在风险的纳税人,有针对性地开展纳税评估,也取得显著成效。

  今年前10个月,福州市国税局风控中心对上市公司十大股东及持有上市公司限售股信息进行分析,筛选出124户存在税收风险的企业,涉及减持226只股票。相关管征局对这些户开展纳税评估,已有多家企业补缴了税款。某汽车维修公司连续减持一上市公司股票未申报,通过评估后补税3700万元。某超市减持一上市公司股票2.8亿股,通过开展反避税谈判,已入库非居民税收5000万元。

  看到以上税务稽查新的措施,大家有可能会感到惊悚。其实,利用社会媒介公开的信息,用于分析和抓取纳税人经济活动痕迹以此验证纳税申报的真实性这种逻辑分析方法,早在10年前就已经在采用了。

  例如:某税务机关在社会媒体公开报道中看到一条新闻,大致意思是:XXX影视艺术文化公司公司投资拍摄电视剧XXXXX,创下国内电视剧之最,后期又投资拍摄了甲、乙两部电视剧......

  这篇报道大家看了也就觉得是一个新闻而已。但是,这篇报道在税务机关信息源中,那就是一个彰显这个影视公司的经济效益。试想一想,该企业投资一部电视剧创下国内电视剧之最,紧接着又拍了两个电视剧,从资金运作的逻辑上分析,该企业第二次投资两个新的电视剧必须是第一部赚了钱,有了不错的利润,才会有资金又连续投资两个新的电视剧。

  所以,根据这一信息,税务机关对该企业纳税申报进行了分析核查,发现该企业一直以来财务报表利润数据都反映的是亏损,这样的财务数据显然是与新闻报道中信息出现了疑点,既然亏损,那怎么可能有钱又紧接着投资了两部新电视剧?那当然,也可能是有新的股东投资、或者企业外借款、或者有人赞助等资金来源,那就查查看吧,结果追踪检查企业财务账务,该企业并没有新的股东投资,也没有外借资金,更没有资金赞助或者捐赠等行为,也就是说没有任何资金流入企业。这就奇怪了,没资金怎么两部新的电视剧拍出来了,往来账也没有欠款啊(赊账)?根据疑点最终检查出该企业利用收入不入账的手法逃逸税收,而且偷税数额占当年度应纳税额的比例均在30%以上。

  随着网络的迅速发展,互联网成为大量信息的载体,而且人们对互联网的依赖已经达到了每日没水可以,每日没有网络不行。人们被网络绑架了。人们已经习惯利用网络在最短的时间里抓取自己需要的信息,而且这种习惯时时刻刻,无时不在的融入在每个人的生活、工作等多方面之中。当我们在寻找信息或在做推介时,也在利用网络输入自己的信息,一来一往,就在网络中留下了诸多的痕迹,被社会共享。

  回想,税务机关近年来建立金税一期开始、CTS征管系统、纳税评估系统、金税三期、到现在税务稽查网络爬虫的研发,大家可以看到税务机关一个完整的管理监控体系已经在逐渐形成。尤其是国家税务局“种植”的网络“爬虫”第一时间就可以通过财务数据检测到企业经营活动的过程以及申报的真实性。这个过程有人工稽查快读的发展到智能爬虫抓取分析时代,其功能就会大大的缩减纳税人涉税违法的隐藏期,如果新的征管法追溯期如网络公布草案20年,那么,纳税人历史中涉税违法痕迹的法律风险将会变的巨大,违法责任的行为人将会承担不可想象的后果。

  就如去年我去一家集团企业做营改增业务调查,闲聊中,我问道:您企业营改增之前属于地税管理,现在要移交国税管理,账面如果存在涉税问题,现在是一个纠正的机会。

  财务回答:我们的账一点问题都没有,这么大的集团企业,而且做了几十年了,绝不会有涉税问题。

  看着他很坚决的回答,我顺手拿起桌上的上年损益表看了一眼,然后又打开电脑调阅了该企业网络上首页信息的介绍,文字信息表述:该企业上年实现收入40亿,实现利润为1980万元,看完后,我又追问道:根据您企业网络介绍的信息来看,假如按照建筑行业税务机关核定利润率10—20%来测算,您企业上年实现利润最起码应该是在4000万以上,可是财务报表实现的利润率过低,为什么?

  财务初始问题回答是:为了投标和漂亮的贷款报表,是虚拟的数据。后来在我的追问和数据异常的推理分析下,才悄悄的说:没想到数据会分析出我们的问题,我们其实有内外两套账。 这么多年税务机关也没有查出来。

  所以,大数据社会信息共享时代,它的科学的理论和实践的思想以及强大的智能机器人分析的原理,都为纳税人提出了警示:侥幸心理将在下一步的延长追溯期被彻底击破。一个社会信息共性的大数据库,只要植入网络爬虫,政府各部门就会在最短的时间内获取到各项情报。

  假设:税务机关利用税务大数据平台和网络“爬虫”技术,对本市某一家汽车企业进行数据分析,按照该企业采取的一项营销措施,即:代办购车贷款的业务进行信息对接,将该企业代办购车贷款与银行贷款的数据与申报纳税的销售收入数据进行比对,如果发现贷款信息与该企业申报的收入出现严重不符,那么税务机关就会纵深检查,也就会发现企业采取真假两套账手法 进行逃逸税的行为。

  例如:某税务机关在网络上看到一条房地产开发企业销售房屋的效益,信息中详细的介绍了该企业与香港某开发上联合开发楼盘......这条信息马上让税务机关产生了异议,根据税收征管信息该企业是100%内资控股,怎么会出来一个外商香港公司,经过追踪核查,发现该企业股东在一年前将30%股权出让给了香港某公司,对于这种出让股权的行为,按照税法规定是要按照公允价格申报缴纳20%个人所得税,但是,税务机关征管信息中并没有该股东申报纳税的记录,经过查验,该企业股东并没有申报纳税。

  又如,某国税局开发网络爬虫分析软件,在最短的时间内轻松的破解了某企业资本运作税务检查过程中等等许多的难题。由此,大家看到,此次税务稽查“网络爬虫”的应用,将会为税务机关征收管理和监管创造了一个更加完善的体系。

  税务机关在一次网络爬虫的操作的演示中:在电脑中打开一个软件,按照需要所取得信息,输入几个关键指标值,点击确定,随着电脑屏幕上一个绿色小虫缓慢的爬过,几十个红色的预警信号出现在屏幕中,此时,税务人员只要点击爬虫抓,它就会抓取到所有的每一个预警信息,具有疑点的企业和疑点具体信息就即刻逐一显现出来。红色预警信号,显示企业在某个方面,存在较高的税收风险(即:纳税异常行为)。

  税务机关种植的这些 “网络爬虫”,还能够将企业涉及的主要风险点和涉税金额初步分析展示出来。网络爬虫的应用,对税务稽查事前采集信息和分析问题,提供了可靠的数据信息。

  现在国地税协作,大数据将共享,利用网络爬虫原理调用百度、搜狗等知名搜索引擎的接口,获取其他方面诸如实际关联公司、经济案件的法院判决结果等信息数据,是轻而易举的事儿。

  以后,税务机关还将进一步探索采集外语信息,将境外上市公司纳入监控范围,不断拓展互联网 应用领域,进一步提升税收征管水平。

  看了以上网络爬虫对税务稽查贡献出的力量,大家是否由衷的感受到, “网络爬虫”这个名字与它自身的功能简直是太贴切了。试想,互联网是张网,只要使用电脑工作的,都是这张网上的一个节点,将爬虫程序比喻成这张网的一个蜘蛛,它会在这张“蜘蛛网”上爬来爬去(当然,一般是按照税务机关需要采集的信息指定的爬行的方向)找到有用的信息(网页信息),它就会将其记录下来,然后接着往下一个节点爬,知道把这个网爬遍——将该网站的所有网页都抓取完.......

  看到 “网络爬虫”的功能,不由的有所冲动的套用和动了动一首歌中的几句词:

  税务稽查种植的网络爬虫正在走向成熟和全面数据的覆盖。谁还说:俺不怕,俺上面有人?.......

  天津市国税局引入林业部门提供的第三方参考数据,按照草皮、各种类苗木的指导价格区间、单亩种植的承载能力、成熟周期,推算发票用量及累计最大开票额度,从而有效防范企业随意开具发票,销售非自产的免税农产品等情况。

  天津市国税局利用百度地图标记企业种植使用地块位置,并将标记地块位置与乡镇土地规划部门和企业实际签订合同比对。由于标记地块位置具有唯一性,避免了虚假合同造成的地块重复。

  某市税务机关利用税务大信息平台,将银行房屋贷款按揭的数据与房地产开发公司申报纳税的销售(预售)收入数据进行比对,其涉税违法行为立刻现形,该房地产公司由于涉税数额巨大,公司相关责任人均被立案处理。

  通过大信息平台,税务将与与网络运营商、认证中心、工商、财政、公安、海关、金融机构、外汇管理、国土规划和物流中心等有关部门实现信息互通、数据互联、资源共享,不断充实、持续扩展、实时更新纳税人信息库,便于稽查比对发现税收疑点!

您可能还会对下面的文章感兴趣: