functions.sillas_vis module

Módulo de visualização do integrande Sillas Rocha, possui 4 funções que servem para explorar a base de dados e fazer plotagens relacionando as vendas de remédios Manipulados de cloroquina por estado, nas datas selecionadas, e por fim, salvar essas plotagens em alguma imagem.

functions.sillas_vis.gera_visualizacao_cloroquina(dados: DataFrame, coluna_principio_ativo: str = 'PRINCIPIO_ATIVO', coluna_estados='UF_VENDA', cmap='plasma', vmax=400, show_figure=False) Axes[código fonte]

Função que usa a biblioteca geobr e a base de dados de medicamentos manipulados para criar uma plotagem.

A função recebe os dados pertinentes da análise e cria uma plotagem baseada no número de vendas da Cloroquina e derivados nos estados brasileiros como um heatmap. Em virtude de reduzir outliers, como São Paulo, do heatmap, o vmax, que limita o valor máximo da coloração foi reduzido.

Parameters

dadospd.DataFrame

Dataframe com os dados a serem análisados

coluna_principio_ativostr, optional

Coluna do data frame que vai ser contabilizada nos estados, by default “PRINCIPIO_ATIVO”

coluna_estadosstr, optional

Coluna dos estados como siglas, ex: “SP”, by default “UF_VENDA”

cmapstr, optional

Color map da visualização, deve ser um color map válido do matplotlib, by default “plasma”

vmaxint, optional

Valor máximo do heatmap, by default 400

show_figurebool, optional

Opção para exibir a figura gerada automaticamente, by default False

Returns

plt.Axes

A figura gerada pela plotagem.

Raises

TypeError

Tipo do dataframe inválido.

ValueError

Colunas de estados e do princípio ativo fora da base de dados.

Test

>>> gera_visualizacao_cloroquina(3)
Dataframe inválido, tente inserir Dataframe.
>>> gera_visualizacao_cloroquina(pd.DataFrame())
Coluna de estados e da contabilização de vendas devem ser colunas válidas do Dataframe. Tente inserir novas colunas.
functions.sillas_vis.mapeia_dados_estaduais(dados_mapeamento: DataFrame, coluna_estados: str) DataFrame[código fonte]

Função que une um dataframe desejado aos dados relacionados ao formato dos estados brasileiros da biblioteca geobr

A blblioteca geobr disponibiliza o formato dos estados brasileiros que auxiliam na plotagem do matplotlib, esta função apenas une a base de dados desejada à base do geobr, para isto, a base de dados desejada deve conter uma coluna com a silga dos estados, ex: “SP”, “RJ”, etc…

Parameters

dados_mapeamentopd.DataFrame

base de dados desejada para a união

coluna_estadosstr

coluna com a silga dos estados

Returns

pd.DataFrame

dataframe com os dados do geobr uniados a base de dados desejada

Raises

TypeError

Tipo incorreto do dataframe ou do nome da coluna

ValueError

Coluna não está na base de dados

Test

>>> dados = pd.DataFrame({"PINCIPIO_ATIVO": ["CLOROQUINA", "DIFOSFATO DE CLOROQUINA", "HIDROXICLOROQUINA", "CLOROQUINA"], "UF": ["SP", "RJ", "CE", "MS"]})
>>> type(mapeia_dados_estaduais(dados, "UF"))
<class 'geopandas.geodataframe.GeoDataFrame'>
>>> mapeia_dados_estaduais(66, "UF")
Dataframe ou coluna de estados inválida, tente inserir outro dataframe ou a coluna como string.
>>> mapeia_dados_estaduais(dados, 13)
Dataframe ou coluna de estados inválida, tente inserir outro dataframe ou a coluna como string.
>>> mapeia_dados_estaduais(dados, "COLUNA_INVÁLIDA")
Coluna não encontrada no Dataframe, tente inserir uma coluna válida do dataframe.
functions.sillas_vis.soma_vendas_por_atributo(dados: DataFrame, atributo: str) DataFrame[código fonte]

Função que soma algum atributo de um dataframe.

Recebe um dataframe e retorna um dataframe contendo o atributo selecionado e a quantidade de observações em uma coluna chamada “vendas”.

Parameters

dadospd.DataFrame

Dataframe com a coluna do atributo

atributostr

atributo onde as observações serão somadas.

Returns

pd.DataFrame

Dataframe que contém como colunas o atributo e “vendas”, sendo as vendas a soma da quantidade de observações do atributo.

Raises

TypeError

Tipo incorreto do dataframe ou do atributo

ValueError

Coluna do atributo não está na base de dados

Test

>>> dados = pd.DataFrame({'PINCIPIO_ATIVO': ['CLOROQUINA', 'DIFOSFATO DE CLOROQUINA', 'HIDROXICLOROQUINA', 'CLOROQUINA'], 'UF': ["SP", "RJ", "RJ", "MS"]})
>>> soma_vendas_por_atributo(dados, "UF")
   UF  vendas
0  RJ       2
1  MS       1
2  SP       1
>>> soma_vendas_por_atributo(66, "UF")
Dataframe ou atributo inválido, tente inserir outro dataframe ou um atributo como string.
>>> soma_vendas_por_atributo(dados, 66)
Dataframe ou atributo inválido, tente inserir outro dataframe ou um atributo como string.
>>> soma_vendas_por_atributo(dados, "COLUNA_INVÁLIDA")
Atributo inválido, insira uma coluna da base de dados.
functions.sillas_vis.visualizacao_sillas(data_inicial: str, data_final: str, pasta_imagens: str, save_fig: bool = True) Axes[código fonte]

Gera imagens a partir de duas datas, da base de dados e da função gera_visualizacao_cloroquina.

A visualização final se baseia em mostrar o aumento da procura por cloroquina com o passar do tempo, por isso, esta função receberá duas datas, uma inicial e uma final, e as converterá em visualizações da cloroquina para cada data entre estas duas datas, de entrada, além disso é necessário informar o diretório em que as pastas ficarão salvas.

Parameters

data_inicialstr

Data inicial da amostragem de dados

data_finalstr

Data final da amostragem de dados

pasta_imagensstr

Diretório onde as imagens serão salvas

save_figbool, optional

Define se as imagens serão salvas ou não, by default True

Raises

IndexError

Valida as datas de entrada.

Test

>>> visualizacao_sillas("2014/01", "2014/01", "DIRETÓRIO_INVÁLIDO")
Não foi possível salvar frame_2014_1.png, erro: [Errno 2] No such file or directory: 'DIRETÓRIO_INVÁLIDO/frame_2014_1.png'
>>> visualizacao_sillas("2013/01", "2015/02", "seu_caminho")
Problemas com a primeira data inserida: 2013/01
Formato da data está incorreto ou ela não está entre Janeiro de 2014 e Novembro de 2021, tente inserir como ANO/mês, ex: '2015/05'.