Ferramentas do usuário

Ferramentas do site


pandas

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
pandas [2024/07/07 10:55] – [Agrupamento de dados] jdospandas [2024/07/07 20:19] (atual) – [Gerar Histogramas] jdos
Linha 12: Linha 12:
 ==== Verificar o tamanho do Data Frame ==== ==== Verificar o tamanho do Data Frame ====
  
-<code>df.shape()</code>+<code>df.shape</code>
  
 ''Return: Linhas x Colunas '' ''Return: Linhas x Colunas ''
Linha 47: Linha 47:
 <code>df.describe()</code> <code>df.describe()</code>
  
 +Obter os valores de describe:
 +<code>
 +alturas = df['alturas']
 +alt_descri = alturas.describe()
 +q1 = alt_descri['25%']
 +mediana = alt_descri['50%']
 +q3 = alt_descri['75%']
  
 +
 +</code>
 +
 +|O ''Return'' de describe() são: quantidades de registros, média, desvio-padrão, menor valor, 1º quartil (25%), mediana (50%), 3º quartil (75%) e maior valor.|
 ==== Trocar o nome das colunas ==== ==== Trocar o nome das colunas ====
  
Linha 57: Linha 68:
 <code>df['nome_coluna'].value_counts()</code> <code>df['nome_coluna'].value_counts()</code>
  
 +==== Ordenação dos valores ====
 +<code>df['nome_coluna'].value_counts().sort_index()</code>
  
 ===== Gerar gráficos ===== ===== Gerar gráficos =====
 +
 +==== Gerar Histogramas ==
 +<code> 
 +df.hist(column="Age",bins=100)
 +plt.show()
 +</code>
 +
 +''Argumento bins é a subdivisão dos dados''
  
 ==== Gráfico de barras verticais ==== ==== Gráfico de barras verticais ====
Linha 108: Linha 129:
 ''Return: uf e mensalidade '' ''Return: uf e mensalidade ''
  
-==== Agrupamento de dados e mostrar a linha completa desses dados ====+==== Localização de linhas do Agrupamento de dados ==== 
 +Como o agrupamento retorna apenas as linhas envolvidas no filtro, utiliza-se o ''loc'' para retornar a linha correspondente aos ids da filtragem realizadas e mostra elas completas. 
 + 
 +<code>df.loc[df.groupby('uf_busca')['mensalidade'].idxmax()] </code> 
 + 
 +==== Filtrar entre valores ==== 
 + 
 +<code>df[(df['mensalidade']>500) & (df['mensalidade']<1000)]</code>
  
-<code>df.loc[df.groupby('uf_busca')['mensalidade'].idxmax()]+==== Query ==== 
 +<code> 
 +df_fem = df.query('Sexo=="F" & Peso <60) 
 +altura_fem = df_fem['Alt'] 
 +  
 +</code>
  
pandas.1720360534.txt.gz · Última modificação: 2024/07/07 10:55 por jdos

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki