Explicando a base de Financiamento do TSE

O TSE disponbiliza desde 2002 as bases de dados de financiamento que podem ser utilizadas em softwares de análise de dados como planilhas eletrônicas ou programas estatísticos. Apesar da abertura dos dados de financiamento para a sociedade ter sido um grande avanço para o aspecto financeiro das eleições, a base de dados apresenta ainda hoje diversas inconsistências e problemas de interpretação nos atributos das tabelas disponibilizadas. Além da pouca documentação disponível, alguns atributos não são claros ou consistentes.

A cada eleição, o TSE disponibiliza o conjunto de dados a partir de quatro tipos de arquivos: (1) doações feitas diretamente aos candidatos, (2) doações feitas diretamente ao partido, (3) doações feitas entre diretórios e comitês partidários e (4) com as despesas realizadas por cada candidato ou partido. O tratamento destes arquivos não é trivial pois a cada ano, a disposição  dos arquivos é modificada o que dificulta a importação dos dados de forma automatizada. Além disso, até 2014 a discriminação dos metadados (o significado de cada dado) não era bem documentada e só em 2016, o TSE começou a fornecer a documentação no mesmo repositório que continham os dados e mesmo assim veremos que a documentação não é muito útil para determinadas análises.

Existem diversas análises interessantes que podem ser feitas na base: encontrar o total doado a um determinado candidato, o total doado a um determinado partido e o total doado por um determinado ente privado. É importante frisar que este estudo tem 2 objetivos: auxiliar pesquisadores interessados no tema e também validar se o nosso entendimento da base está correto. Ao disponiblizar os scripts (os códigos em Python que servem de base para a análise), outros pesquisadores podem reproduzir os exemplos e contestar ou melhorar os resultados. Dessa forma, ao receber o feedback de pesquisadores mais experientes que já trabalham com essa base, poderemos melhorar os métodos de análise. Vamos aos exemplos!

Análise Exploratória Inicial - Conhecendo os dados

O primeiro passo é entender como estão dispostos os dados que o TSE fornece. Os dados vêm organizados em arquivos CSV compactados em arquivos ZIP. O TSE disponibiliza um arquivo para cada estado e um grande arquivo com o sufixo "_brasil" que contém o conjunto de todos os registros de cada estado.

Assim, o primeiro passo é descompactar o arquivo e em seguida abrir o CSV no LibreOffice ou no Excel. Abra o arquivo do Acre, por exemplo, pois o arquivo Brasil demora muito mais para carregar. Ao abrir no LibreOffice, você deve especificar que o formato do arquivo está na codificação ISO-8859-1 e está delimitado por ";". Uma outra forma de abrir o arquivo é diretamente pelo Python que é a forma que utilizaremos para analisar os dados.

Umas das formas comuns de trabalhar com Python é através do Jupyter Notebook. O Jupyter permite que você crie um caderno de anotações a medida que você analisa e experimenta os dados. Dessa forma, você consegue montar o histórico de todas as ações realizadas e permite assim que outros pesquisadores possam reproduzir e estender a sua pesquisa.

Clique neste link para ver na prática como funciona.

Total Doado a uma determinada candidatura

A operação mais simples de totalização é a de doações de uma determinada candidatura pois basta utiliza um único arquivo, o de candidaturas. Essa mesma operação também pode ser feita diretamente no aplicativo DivulgaWeb do TSE mas a partir do Python poderemos faremos algumas totalizações interessantes.

É importante notar alguns detalhes nos atributos do registro. O primeiro atributo é o 'Tipo receita'. Ele tem os seguintes valores:

Recursos de pessoas jurídicas
Recursos de outros candidatos/comitês
Recursos de partido político
Doações pela Internet
Recursos de pessoas físicas
Recursos de origens não identificadas
Recursos próprios
Rendimentos de aplicações financeiras
Comercialização de bens ou realização de eventos

Vale notar que o "Doações pela Internet" são exclusivas para Doação de Pessoa Física, isto é, para uma análise da origem do dinheiro esta categoria pode ser incorporada na doação de pessoas físicas. Já as categorias de origens não identificas, rendimentos de aplicação e Comercialização de bens são geralmente valores muito pequenos se comparados com as outras categorias e assim, podem ser desprezadas.

Doação realizadas por um ente privado

Para se obter o total doado por uma determinada pessoa jurídica (PJ) ou pessoa física (PF), deve-se consultar os arquivos de doação de candidatos e o de doação de partidos. O terceiro tipo de arquivo (movimentação financeira entre os comitês e diretórios) não deve ser utilizado pois os valores ali apresentados já foram contabilizados inicialmente nos 2 primeiros arquivos. Assim, o foco deve ser as doações recebidas pelos agentes partidários (AGP) ou  diretamente recebida pelo candidato. São aqui denominados AGPs diretórios nacionais, estaduais, municipais ou comitês de campanha.

Por exemplo, uma doação feita ao partido por uma pessoa física ou jurídica pode não ser encaminhada a um determinado candidato, ou seja, uma vez que a doação entra no caixa de um AGP, este não necessariamente será utilizado para um determinado candidato. Esta realidade se encaixa no ditado popular que diz “dinheiro não tem rastro”, ou seja, uma vez que o dinheiro entra em uma conta-corrente única (no caso a conta corrente de um agente partidário), perde-se o rastro de como ele será gasto ou transferido no futuro.

Para tentar rastrear o caminho do dinheiro, o TSE procurou incluir no registro de uma doações a figura do Doador Original. Ou seja, quando a doação é feita por um partido a um candidato, existe a possibilidade de que ele indique que a doação foi feita por uma pessoa física ou jurídica. Em resumo, a doação saiu do caixa do partido, mas o doador original foi uma pessoa física ou jurídica.

Entretanto, nem sempre o valor doado por uma empresa é discriminado pois fica a critério do AGP definir como será feito o rateio entre os candidatos de uma doação específica. Para comprovar o argumento construímos um estudo de caso que detalha as doações de uma empresa aleatório que realizou em 2014 doações utilizando as 3 modalidades de doação (para o partido, para um candidato e diretamente para os diretórios estaduais).

Para demonstrar graficamente a movimentação das doações, optamos por utilizar um gráfico Sankey

Sendo PJ a empresa em questão, BR o Diretório Nacional do partido, DF, SC, BA, AC os diretórios estaduais com a sigla correspondente das unidades da federação e os de prefixo COM são os comitês eleitorais de cada estado.

Duas questões foram levantadas ao analisar o gráfico. (1) Como o Diretório Nacional pode ter feito mais doações aos candidatos do que o valor recebido pela empresa? (2) como o diretório do DF pode ter feito doações aos candidatos sem que houvesse uma doação direta da empresa ou do partido para o Diretório? De onde o dinheiro surgiu? A dúvida foi tirada ao analisar detalhadamente as doações que geraram essa movimentação. A doação original não aparecia pois o diretório NÃO era do PT. Foi o diretório do PMDB que fez a doação para o candidato a governador do PT!

Ou seja, além das movimentações internas do partido, deve-se levar em conta as doações feitas entre partidos diferentes. Ao refazer o gráfico discriminando agora corretamente os diretórios de cada partido, conseguimos ver o novo gráfico:

Agora os 2 pontos levantados foram corrigidos e é possível visualizar as movimentações entre os partidos. Por fim, um outro ponto a notar é que nem toda doação feita ao AGP é direcionada aos candidatos, ou seja, a empresa doa o dinheiro para o partido mas apenas parte do dinheiro é direcionada ao candidato. Pelo gráfico Sankey é possível ver rapidamente esta situação nas barras que apresentam um "saldo" pois o fluxo de entrada na barra azul é maior que o fluxo de saída. Nesse exemplo, é possivel visualizar este caso na barra PT-BR e com COM-PT-AC.

O processamento completo de todos os gráficos pode ser visto clicando nesse notebook.

Em análises futuras, vamos procurar encontrar os agrupamentos por partido a partir do conjunto de todas as doações e também por setores econômicos.