Ferramentas do usuário

Ferramentas do site


pandas

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
pandas [2024/07/07 10:36] – [Filtrar por maior valor] jdospandas [2024/07/07 20:19] (atual) – [Gerar Histogramas] jdos
Linha 12: Linha 12:
 ==== Verificar o tamanho do Data Frame ==== ==== Verificar o tamanho do Data Frame ====
  
-<code>df.shape()</code>+<code>df.shape</code>
  
 ''Return: Linhas x Colunas '' ''Return: Linhas x Colunas ''
Linha 47: Linha 47:
 <code>df.describe()</code> <code>df.describe()</code>
  
 +Obter os valores de describe:
 +<code>
 +alturas = df['alturas']
 +alt_descri = alturas.describe()
 +q1 = alt_descri['25%']
 +mediana = alt_descri['50%']
 +q3 = alt_descri['75%']
  
 +
 +</code>
 +
 +|O ''Return'' de describe() são: quantidades de registros, média, desvio-padrão, menor valor, 1º quartil (25%), mediana (50%), 3º quartil (75%) e maior valor.|
 ==== Trocar o nome das colunas ==== ==== Trocar o nome das colunas ====
  
Linha 57: Linha 68:
 <code>df['nome_coluna'].value_counts()</code> <code>df['nome_coluna'].value_counts()</code>
  
 +==== Ordenação dos valores ====
 +<code>df['nome_coluna'].value_counts().sort_index()</code>
  
 ===== Gerar gráficos ===== ===== Gerar gráficos =====
 +
 +==== Gerar Histogramas ==
 +<code> 
 +df.hist(column="Age",bins=100)
 +plt.show()
 +</code>
 +
 +''Argumento bins é a subdivisão dos dados''
  
 ==== Gráfico de barras verticais ==== ==== Gráfico de barras verticais ====
Linha 85: Linha 106:
 <code>df_objeto_filtrado = df[df['nome_coluna']=='nome_objeto_a_ser_filtrado']</code> <code>df_objeto_filtrado = df[df['nome_coluna']=='nome_objeto_a_ser_filtrado']</code>
  
 +==== Mostrar apenas uma coluna do Data Frame ====
 +
 +<code>df['nome_coluna']</code>
 +
 +==== Mostrar duas ou mais colunas do Data Frame ====
 +
 +<code>df[['nome_coluna1','nome_coluna2','nome_coluna3']]</code>
 ==== Filtrar por um string e conta as aparições ==== ==== Filtrar por um string e conta as aparições ====
  
Linha 91: Linha 119:
 ==== Filtrar por maior valor ==== ==== Filtrar por maior valor ====
 <code>df[df['nome_coluna']==df['nome_coluna'].max()]</code> <code>df[df['nome_coluna']==df['nome_coluna'].max()]</code>
 +
 +==== Filtrar por menor valor ====
 +<code>df[df['nome_coluna']==df['nome_coluna'].min()]</code>
 +
 +
 +==== Agrupamento de dados ====
 +<code>df.groupby('uf_busca')['mensalidade'].max()</code>
 +
 +''Return: uf e mensalidade ''
 +
 +==== Localização de linhas do Agrupamento de dados ====
 +Como o agrupamento retorna apenas as linhas envolvidas no filtro, utiliza-se o ''loc'' para retornar a linha correspondente aos ids da filtragem realizadas e mostra elas completas.
 +
 +<code>df.loc[df.groupby('uf_busca')['mensalidade'].idxmax()] </code>
 +
 +==== Filtrar entre valores ====
 +
 +<code>df[(df['mensalidade']>500) & (df['mensalidade']<1000)]</code>
 +
 +==== Query ====
 +<code>
 +df_fem = df.query('Sexo=="F" & Peso <60)
 +altura_fem = df_fem['Alt']
 + 
 +</code>
  
pandas.1720359366.txt.gz · Última modificação: 2024/07/07 10:36 por jdos

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki