Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

--- pandas [2024/07/07 10:36] – [Filtrar por maior valor] jdos
+++ pandas [2024/07/07 20:19] (atual) – [Gerar Histogramas] jdos
@@ Linha 12: / Linha 12: @@
 ==== Verificar o tamanho do Data Frame ====
-<code>df.shape()</code>
+<code>df.shape</code>
 ''Return: Linhas x Colunas ''
@@ Linha 47: / Linha 47: @@
 <code>df.describe()</code>
+Obter os valores de describe:
+<code>
+alturas = df['alturas']
+alt_descri = alturas.describe()
+q1 = alt_descri['25%']
+mediana = alt_descri['50%']
+q3 = alt_descri['75%']
+</code>
+|O ''Return'' de describe() são: quantidades de registros, média, desvio-padrão, menor valor, 1º quartil (25%), mediana (50%), 3º quartil (75%) e maior valor.|
 ==== Trocar o nome das colunas ====
@@ Linha 57: / Linha 68: @@
 <code>df['nome_coluna'].value_counts()</code>
+==== Ordenação dos valores ====
+<code>df['nome_coluna'].value_counts().sort_index()</code>
 ===== Gerar gráficos =====
+==== Gerar Histogramas ==
+<code>
+df.hist(column="Age",bins=100)
+plt.show()
+</code>
+''Argumento bins é a subdivisão dos dados''
 ==== Gráfico de barras verticais ====
@@ Linha 85: / Linha 106: @@
 <code>df_objeto_filtrado = df[df['nome_coluna']=='nome_objeto_a_ser_filtrado']</code>
+==== Mostrar apenas uma coluna do Data Frame ====
+<code>df['nome_coluna']</code>
+==== Mostrar duas ou mais colunas do Data Frame ====
+<code>df[['nome_coluna1','nome_coluna2','nome_coluna3']]</code>
 ==== Filtrar por um string e conta as aparições ====
@@ Linha 91: / Linha 119: @@
 ==== Filtrar por maior valor ====
 <code>df[df['nome_coluna']==df['nome_coluna'].max()]</code>
+==== Filtrar por menor valor ====
+<code>df[df['nome_coluna']==df['nome_coluna'].min()]</code>
+==== Agrupamento de dados ====
+<code>df.groupby('uf_busca')['mensalidade'].max()</code>
+''Return: uf e mensalidade ''
+==== Localização de linhas do Agrupamento de dados ====
+Como o agrupamento retorna apenas as linhas envolvidas no filtro, utiliza-se o ''loc'' para retornar a linha correspondente aos ids da filtragem realizadas e mostra elas completas.
+<code>df.loc[df.groupby('uf_busca')['mensalidade'].idxmax()] </code>
+==== Filtrar entre valores ====
+<code>df[(df['mensalidade']>500) & (df['mensalidade']<1000)]</code>
+==== Query ====
+<code>
+df_fem = df.query('Sexo=="F" & Peso <60)
+altura_fem = df_fem['Alt']
+</code>