Reconocimiento
Vista previa del dataset crudo
"CUNDINAMARCA","FUNZA","Maíz","Por establecer","Plano","Buen drenaje","Aspersión","15-15-15","306"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","Buen drenaje","Aspersión","UREA","677"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","Buen drenaje","Aspersión","UREA","678"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","No indica","No indica","No indica","1.047"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","No indica","No indica","No indica","1.048"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","No indica","No indica","No indica","1.049"
"CUNDINAMARCA","FUNZA","Calas","Establecido","Plano","Buen drenaje","Aspersión","No indica","4.533"
"CUNDINAMARCA","FUNZA","Calas","Establecido","Plano","Buen drenaje","Aspersión","No indica","4.583"
"CUNDINAMARCA","FUNZA","Calas","Establecido","Plano","Buen drenaje","Aspersión","No indica","4.761"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","Buen drenaje","Aspersión","No indica","7.144"
"CUNDINAMARCA","FUNZA","Maracuyá","Por establecer","Ondulado","Buen drenaje","Goteo","No indica","7.395"
"CUNDINAMARCA","FUNZA","Granadilla","Establecido","Plano","Buen drenaje","No indica","No indica","7.837"
"CUNDINAMARCA","FUNZA","Maíz","Por establecer","Plano","Buen drenaje","Aspersión","BIOCOMPOST
"CUNDINAMARCA","FUNZA","Gulupa","Por establecer","Plano","Buen drenaje","No indica","No indica","18.242" ...
Este es nuestro dataset de análisis
El conjunto de datos corresponde a registros agrícolas levantados a nivel municipal (Funza, Cundinamarca), con información sobre cultivos, condiciones del terreno y prácticas de manejo.
Cada registro representa un lote agrícola con sus características.
En esta sección se presenta una vista preliminar del dataset crudo, previo a cualquier proceso de limpieza o transformación.
| Columna | Tipo | Comentario |
|---|---|---|
| Departamento | Categórica nominal | No tiene orden |
| Municipio | Categórica nominal | No tiene orden |
| Cultivo | Categórica nominal | No tiene orden |
| Estado | Categórica nominal | No tiene orden |
| Topografia | Categórica ordinal | Tiene orden implícito |
Tipos de variables
La mayoría de las variables son categóricas (nominales u ordinales), lo que limita los tipos de análisis estadísticos que podemos realizar.
El enfoque será exploratorio y descriptivo, centrado en distribuciones, frecuencias y asociaciones entre categorías.
Municipio de Funza
Características iniciales
- El dataset tiene 88 filas y 9 columnas
- Todas las columnas principales son de tipo
category - No hay valores nulos en los registros
- La cardinalidad varía entre 1 (Departamento) y 88 (id de los lotes)
- Cultivo tiene la mayor diversidad con 27 valores únicos
Cardinalidad y valores únicos
Algunos valores poseen diferencias sutiles pero significativas a nivel de categorización debido a mayúsculas, tildes, espacios y variaciones semánticas de igual significado que crean categorías nuevas que deben normalizarse.
Por ejemplo, en la columna Riego, se detectaron inconsistencias que se agruparon bajo un mismo concepto:
❌ Sin normalizar
Cardinalidad: 9
- - Aspersión
- - Cañon
- - Goteo
- - GOTEO
- - Manguera
- - No Indica
- - No indica
- - No Tiene
- - no
✅ Normalizado
Cardinalidad: 6
- - Aspersión
- - Cañon
- - Goteo
- - Manguera
- - No indica
- - No tiene
Valores únicos después de la normalización
A continuación se presentan todas las categorías y sus valores únicos después del proceso de limpieza y normalización.
Departamento
Cardinalidad: 1
Municipio
Cardinalidad: 1
Cultivo
Cardinalidad: 27
Estado
Cardinalidad: 3
Topografia
Cardinalidad: 7
Drenaje
Cardinalidad: 4
Riego
Cardinalidad: 6
Fertilizantes aplicados
Cardinalidad: 15