functions.sillas_vis module
Módulo de visualização do integrande Sillas Rocha, possui 4 funções que servem para explorar a base de dados e fazer plotagens relacionando as vendas de remédios Manipulados de cloroquina por estado, nas datas selecionadas, e por fim, salvar essas plotagens em alguma imagem.
- functions.sillas_vis.gera_visualizacao_cloroquina(dados: DataFrame, coluna_principio_ativo: str = 'PRINCIPIO_ATIVO', coluna_estados='UF_VENDA', cmap='plasma', vmax=400, show_figure=False) Axes[código fonte]
Função que usa a biblioteca geobr e a base de dados de medicamentos manipulados para criar uma plotagem.
A função recebe os dados pertinentes da análise e cria uma plotagem baseada no número de vendas da Cloroquina e derivados nos estados brasileiros como um heatmap. Em virtude de reduzir outliers, como São Paulo, do heatmap, o vmax, que limita o valor máximo da coloração foi reduzido.
Parameters
- dadospd.DataFrame
Dataframe com os dados a serem análisados
- coluna_principio_ativostr, optional
Coluna do data frame que vai ser contabilizada nos estados, by default “PRINCIPIO_ATIVO”
- coluna_estadosstr, optional
Coluna dos estados como siglas, ex: “SP”, by default “UF_VENDA”
- cmapstr, optional
Color map da visualização, deve ser um color map válido do matplotlib, by default “plasma”
- vmaxint, optional
Valor máximo do heatmap, by default 400
- show_figurebool, optional
Opção para exibir a figura gerada automaticamente, by default False
Returns
- plt.Axes
A figura gerada pela plotagem.
Raises
- TypeError
Tipo do dataframe inválido.
- ValueError
Colunas de estados e do princípio ativo fora da base de dados.
Test
>>> gera_visualizacao_cloroquina(3) Dataframe inválido, tente inserir Dataframe.
>>> gera_visualizacao_cloroquina(pd.DataFrame()) Coluna de estados e da contabilização de vendas devem ser colunas válidas do Dataframe. Tente inserir novas colunas.
- functions.sillas_vis.mapeia_dados_estaduais(dados_mapeamento: DataFrame, coluna_estados: str) DataFrame[código fonte]
Função que une um dataframe desejado aos dados relacionados ao formato dos estados brasileiros da biblioteca geobr
A blblioteca geobr disponibiliza o formato dos estados brasileiros que auxiliam na plotagem do matplotlib, esta função apenas une a base de dados desejada à base do geobr, para isto, a base de dados desejada deve conter uma coluna com a silga dos estados, ex: “SP”, “RJ”, etc…
Parameters
- dados_mapeamentopd.DataFrame
base de dados desejada para a união
- coluna_estadosstr
coluna com a silga dos estados
Returns
- pd.DataFrame
dataframe com os dados do geobr uniados a base de dados desejada
Raises
- TypeError
Tipo incorreto do dataframe ou do nome da coluna
- ValueError
Coluna não está na base de dados
Test
>>> dados = pd.DataFrame({"PINCIPIO_ATIVO": ["CLOROQUINA", "DIFOSFATO DE CLOROQUINA", "HIDROXICLOROQUINA", "CLOROQUINA"], "UF": ["SP", "RJ", "CE", "MS"]}) >>> type(mapeia_dados_estaduais(dados, "UF")) <class 'geopandas.geodataframe.GeoDataFrame'>
>>> mapeia_dados_estaduais(66, "UF") Dataframe ou coluna de estados inválida, tente inserir outro dataframe ou a coluna como string.
>>> mapeia_dados_estaduais(dados, 13) Dataframe ou coluna de estados inválida, tente inserir outro dataframe ou a coluna como string.
>>> mapeia_dados_estaduais(dados, "COLUNA_INVÁLIDA") Coluna não encontrada no Dataframe, tente inserir uma coluna válida do dataframe.
- functions.sillas_vis.soma_vendas_por_atributo(dados: DataFrame, atributo: str) DataFrame[código fonte]
Função que soma algum atributo de um dataframe.
Recebe um dataframe e retorna um dataframe contendo o atributo selecionado e a quantidade de observações em uma coluna chamada “vendas”.
Parameters
- dadospd.DataFrame
Dataframe com a coluna do atributo
- atributostr
atributo onde as observações serão somadas.
Returns
- pd.DataFrame
Dataframe que contém como colunas o atributo e “vendas”, sendo as vendas a soma da quantidade de observações do atributo.
Raises
- TypeError
Tipo incorreto do dataframe ou do atributo
- ValueError
Coluna do atributo não está na base de dados
Test
>>> dados = pd.DataFrame({'PINCIPIO_ATIVO': ['CLOROQUINA', 'DIFOSFATO DE CLOROQUINA', 'HIDROXICLOROQUINA', 'CLOROQUINA'], 'UF': ["SP", "RJ", "RJ", "MS"]}) >>> soma_vendas_por_atributo(dados, "UF") UF vendas 0 RJ 2 1 MS 1 2 SP 1
>>> soma_vendas_por_atributo(66, "UF") Dataframe ou atributo inválido, tente inserir outro dataframe ou um atributo como string.
>>> soma_vendas_por_atributo(dados, 66) Dataframe ou atributo inválido, tente inserir outro dataframe ou um atributo como string.
>>> soma_vendas_por_atributo(dados, "COLUNA_INVÁLIDA") Atributo inválido, insira uma coluna da base de dados.
- functions.sillas_vis.visualizacao_sillas(data_inicial: str, data_final: str, pasta_imagens: str, save_fig: bool = True) Axes[código fonte]
Gera imagens a partir de duas datas, da base de dados e da função gera_visualizacao_cloroquina.
A visualização final se baseia em mostrar o aumento da procura por cloroquina com o passar do tempo, por isso, esta função receberá duas datas, uma inicial e uma final, e as converterá em visualizações da cloroquina para cada data entre estas duas datas, de entrada, além disso é necessário informar o diretório em que as pastas ficarão salvas.
Parameters
- data_inicialstr
Data inicial da amostragem de dados
- data_finalstr
Data final da amostragem de dados
- pasta_imagensstr
Diretório onde as imagens serão salvas
- save_figbool, optional
Define se as imagens serão salvas ou não, by default True
Raises
- IndexError
Valida as datas de entrada.
Test
>>> visualizacao_sillas("2014/01", "2014/01", "DIRETÓRIO_INVÁLIDO") Não foi possível salvar frame_2014_1.png, erro: [Errno 2] No such file or directory: 'DIRETÓRIO_INVÁLIDO/frame_2014_1.png'
>>> visualizacao_sillas("2013/01", "2015/02", "seu_caminho") Problemas com a primeira data inserida: 2013/01 Formato da data está incorreto ou ela não está entre Janeiro de 2014 e Novembro de 2021, tente inserir como ANO/mês, ex: '2015/05'.