¿Pueden las nuevas tecnologías ayudar a perseguir los fraudes tributarios?

(Por Luis de la Fuente Valentín, UNIR - Universidad Internacional de La Rioja) El 1 de febrero de 2021 la Agencia Tributaria española anunció la implantación de un sistema de análisis basado en big data para la detección de diversos tipos de fraude fiscal. Esta estrategia ha quedado consolidada con su publicación en el BOE.

Image description

La noticia tuvo gran repercusión por dos motivos: por un lado, está el interés que genera la aplicación de tecnologías innovadoras en algo que nos afecta a todos. Por otra parte, ha coincidido en el tiempo con el anuncio hecho por El Rubius, conocido youtuber con gran exposición mediática, de que traslada su residencia a Andorra, donde se tributa menos IRPF que en España.

Ya la agencia tributaria gallega había hecho un anuncio similar a mediados del año pasado.

El ‘big data’ que todo lo ve (o a eso aspira)

¿Es fraude fiscal desplazar la residencia fiscal a Andorra? No, siempre y cuando esa sea también la residencia real de la persona. Por el contrario, si se tiene la residencia habitual en España pero la residencia fiscal está en Andorra, sí podría haber fraude fiscal.

Un inspector experimentado que analice en detalle a un contribuyente sabrá buscar los indicios de residencia. Cada factura emitida revela el lugar de residencia del cliente, y lo normal será que este tenga su actividad económica cerca. Otras pistas pueden ser la petición de ayudas y subvenciones asociadas a una ubicación específica, o el alquiler habitual de servicios en un sitio determinado. Aunque son solo indicios y no suponen una prueba de residencia, su suma aumenta la sospecha de fraude, a partir de la cual un inspector puede decidir investigar en profundidad al contribuyente.

Este proceso de investigación es muy costoso e inabordable a gran escala. Pero ahora la Agencia Tributaria tiene la capacidad de investigar de forma automatizada. En concreto, ha señalado que: “Estas herramientas, basadas en el procesamiento de ‘big data’ , han hecho posible efectuar de manera sistemática el análisis de residencia (…) para poder determinar la presencia durante más de 183 días en territorio español, la existencia en nuestro país de un centro de intereses económicos relevante y operativo, así como la existencia de relaciones familiares que permitan inferir la residencia en España.”

El impacto mediático de la noticia ha sido evidente. Cabe preguntarse si existe la posibilidad real de utilizar el big data para llevar a cabo esta tarea de detección. Es decir, ¿qué retos deben afrontarse para poder automatizar a gran escala un análisis que hasta ahora sólo podía ser abordado por un inspector experimentado?

Como todo proyecto de análisis de datos para la toma de decisiones, son varios los retos tecnológicos que hay que tener en cuenta para garantizar el éxito del proyecto. En este caso son:

  • La disponibilidad y el gobierno de datos.
  • El análisis.
  • Las infraestructuras.

A continuación, se resume cada uno de estos aspectos.

Disponibilidad y gobierno de datos

Por ser el punto de partida, la disponibilidad de los datos es siempre una piedra angular de todo proyecto. Se trata de determinar si se dispone, o se puede disponer con la metodología adecuada, de los datos que permitan realizar los análisis previstos.

La Agencia Tributaria cuenta con una gran cantidad de datos en forma de declaraciones de renta y patrimonial de la gran mayoría de contribuyentes. El cruce de estos datos permite identificar “cosas raras”. ¿Por qué un contribuyente que reside en Valencia ha solicitado una ayuda para la escolarización de hijos en A Coruña?, ¿por qué la mayor parte de los clientes de este contribuyente están en A Coruña?

Los datos están ahí, disponibles. Pero eso no basta: es necesario saber gestionarlos para que las diferentes bases de datos se crucen adecuadamente. Sobre todo, es importante que los catálogos de datos se sometan a procesos de limpieza que permitan confiar en ellos. Esta labor de ordenación es lo que se conoce como gobierno de datos. Si bien es cierto que se trata de una labor de altísima complejidad, es un proyecto abordable si se cuenta con la inversión adecuada.

La Agencia Tributaria ha anunciado esta herramienta en 2021 pero para ello ha tenido que abordar antes un gran proyecto de gobierno de datos, en el que seguramente lleve años trabajando.

Análisis de datos

Tomemos como base los indicios de residencia habitual presentados en el ejemplo anterior. Un análisis basado en inteligencia artificial replica de forma automatizada la labor de investigación realizada por un experto. ¿Es posible sustituir al inspector experimentado por una máquina que analice la documentación?

Las técnicas para la detección de fraude son un tema de investigación que cuenta con numerosas publicaciones en revistas científicas. Estas técnicas van desde una simple aplicación de reglas de filtrado hasta complejos sistemas de redes neuronales capaces de detectar anomalías con gran precisión.

Para muestra, un botón: un trabajo de fin de máster de la UNIR demostró que se pueden utilizar técnicas de machine learning para la detección de fraude en la importación y exportación de mercancías de origen animal. La investigación obtuvo un ratio de 90% de verdaderos positivos; así, es perfectamente posible utilizar la inteligencia artificial para este tipo de análisis de datos.

Infraestructuras

Es sencillo analizar cientos de registros, pero no lo es tanto analizar cientos de miles. La respuesta del sistema de análisis debe ser rápida y, cuando se habla de big data, la infraestructura debe ser estudiada adecuadamente.

En España hay en torno a 20 millones de declarantes, cada uno de ellos con sus cuentas bancarias, salarios, actividades económicas, rendimiento de bienes inmuebles, subsidios… Es decir, una cantidad de datos descomunal. Además, esa cantidad de datos crece si consideramos las relaciones entre ellos. Por ejemplo, una factura tiene un emisor y un pagador y eso implica una relación entre dos declarantes.

El problema está en analizar 20 millones de registros, centrándose cada vez en las particularidades de cada declarante y tener el resultado a tiempo. Por suerte es un problema ya resuelto. Un sistema basado en tecnología Apache Spark permite el procesamiento distribuido de los datos, lo que otorga al sistema la escalabilidad necesaria para abordar un problema como el de analizar los comportamientos de los contribuyentes de un país.

Conclusiones

En este artículo se han expuesto brevemente los tres principales retos técnicos para que el proyecto de detección de fraude presentado por la Agencia Tributaria tenga éxito. Estos retos son: el gobierno del dato, la aplicación de técnicas de inteligencia artificial y la disponibilidad de infraestructuras.

Hay buenos argumentos para considerar que la Agencia Tributaria tiene resueltos estos retos. De este modo, la detección de fraude a través del big data es una realidad que permitirá detectar, entre otros, fraudes asociados a una residencia fiscal falsa.

Luis de la Fuente Valentín, Profesor del Máster Universitario en Análisis y Visualización de Datos Masivos, UNIR - Universidad Internacional de La Rioja

Este artículo fue publicado originalmente en The Conversation. Lea el original.

The Conversation

Tu opinión enriquece este artículo:

Las empresas del sector de los productos infantiles en Cataluña (un total de 488) generan un volumen de negocio de más de 4.400 millones de euros

El sector de los productos infantiles en Cataluña concentra 488 empresas que generan un volumen de negocio de 4.424 millones de euros anuales, que equivaldría al 1,7% del PIB. Son los datos principales de la actualización del estudio sectorial, que ha elaborado el Gobierno por medio de ACCIÓ -la agencia para la competitividad de la empresa del Departamento de Empresa y Trabajo- con la colaboración del Kid's Cluster, y que se ha presentado este jueves en el marco de la asamblea general del Kid's Cluster. El acto ha contado con la participación del director ejecutivo de ACCIÓ, Joan Romero i Circuns, y la mánager de inteligencia de mercado de la agencia, Imma Rodríguez López.

De los Rolling a Karol G: El FC Barcelona anuncia una nueva colaboración (esta vez con una de las reinas del Reggaeton)

El FC Barcelona continúa lanzando nuevos modelos de camisetas, esta vez junto a la reconocida cantante colombiana Karol G, y su particular logo de corazón con espinas. La unión, gracias a la colaboración con Spotify, ha permitido adentrarse en nuevos códigos, como el lifestyle, a través de un elemento de moda, al igual que con otros grandes artistas como Drake, Rosalía y los Rolling Stones.

La brecha entre el precio del alquiler y las expectativas de los inquilinos aumenta en Madrid (mientras que en Barcelona se reduce)

HousingAnywhere, la mayor plataforma europea de alquiler a medio plazo, publica su primer Barómetro de la brecha del alquiler, que pone de manifiesto la disparidad entre el precio del alquiler que dicta el mercado y las expectativas de los inquilinos a la hora de buscar alojamiento. En ciudades como Colonia, Alemania, la brecha es pronunciada, con una tasa de diferencia del 47,1% en términos relativos y una discrepancia absoluta de 477€. A la cola del ranking se encuentra Róterdam con una discrepancia del 3,1%, lo que se traduce en 47€. 

Hace 10 años un piso en Cataluña costaba 172.500 euros (hoy cuesta 222.900)

El precio acumulativo de la vivienda en venta ha subido en Cataluña un 29% en los últimos 10 años, un 10% en los últimos 5 años y un 4% en el último año. Sin embargo, ha caído un -16% respecto a hace 15 años (2009), según el análisis “Variación acumulativa de la vivienda en España en 2024”, basado en los precios de la vivienda en venta del mes de febrero de los últimos 15 años del Índice Inmobiliario Fotocasa.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.