Paola Correa (PhD Ecología PUC, CAPES), Solange Benítez (cPhD Agronomía PUC) y Horacio Contreras (Austral Falcon). Desde hace algunos años el mundo científico comenzó a usar grandes bases de datos para analizar patrones biológicos, lo que se conoce como ‘data science’ (Tukey 1962). La ciencia de datos unifica la estadística, la matemática y el análisis de datos con el fin de comprender y analizar fenómenos reales usando métodos, procesos y algoritmos para extraer conocimiento e información (Hayashi 1998, Dhar 2013). Esta ciencia se encarga de utilizar bases de datos, inventarios o repositorios climáticos online, resultados de otros investigadores u organizaciones y nuevas herramientas tecnológicas como imágenes satelitales o inteligencia artificial para contestar nuevas preguntas, aprovechando la gran cantidad de información recolectada por años. Esta nueva ciencia tiene como ventaja que un mismo grupo de datos se puede analizar de maneras distintas pudiendo ayudar a resolver diferentes preguntas. Pero ¿en verdad necesitamos la recopilación y análisis de datos para entender los problemas que se presentan día a día y más aún en la agricultura? Aparentemente la respuesta es que sí y la descubriremos a lo largo de este artículo. La aplicabilidad de los datos para resolver problemas es evidente, un ejemplo de esto es a través de nuestros censos poblacionales y las emisiones de CO2 encontradas en la Antártida donde se relaciona el gran impacto que genera la humanidad en el cambio climático y cómo repercute esto en los cultivos agrícolas. Sin estos datos y su análisis, probablemente no se tendría una explicación causal a los efectos que cada vez y con más fuerza genera el cambio climático sobre los seres vivos. Es por esto por lo que diferentes ciencias se han enfocado en la recopilación y uso de los datos para aprovechar la gran cantidad que existen y analizar las problemáticas de una manera global, entendiendo cuales son los factores que afectan a los ecosistemas con el fin de poder predecir sus cambios y tomar decisiones al respecto. Ejemplos de la aplicabilidad de los datos son notorios en distintas disciplinas como la ecología en el análisis de especies en peligro de extinción o con brotes poblacionales (Lima et al. 2008), epidemiología en el análisis de enfermedades como el COVID-19 (Correa-Cuadros & Muñoz 2020), plagas forestales que destruyen hectáreas de bosques (Berryman 2012), pesquerías y sus colapsos (Lima et al. 2020), economía y procesos demográficos (Turchin & Korotayev 2020), antropología con análisis de sociedades antiguas (Lima et al. 2020), entre otros. Uno de los objetivos primordiales de la ciencia de los datos es conectar la teoría con la información para entender muchos de los fenómenos que están ocurriendo actualmente, como el calentamiento global y sus efectos en los cultivos o los factores que afectan el rendimiento. En la agricultura tenemos el registro de patrones que se repiten, como los daños por plagas y enfermedades, factores climáticos que afectan el crecimiento de los frutos o prácticas que disminuyen la productividad. Así mismo, observamos el cambio de estas tendencias con el paso de las temporadas y muy seguramente algunas de ellas las hemos documentado en archivos, pero los datos no están disponibles y no son analizados; lo que nos hace perder todo el potencial de esa información para entender qué está pasando con nuestros cultivos y poder encontrar soluciones. Es por esto, que es necesario hacer un puente entre la teoría y práctica de la agricultura con el análisis de datos y modelos de predicción, para transformarla en una ciencia de precisión ya que estamos desaprovechando el uso de los datos para encontrar patrones, tendencias y/o relaciones olvidadas u omitidas. La agricultura en Chile ha tardado en comenzar a implementar esta nueva ciencia y darle la importancia necesaria a los datos y su análisis mediante modelos de predicción de plagas y enfermedades, rendimiento de los cultivos, entre otros (Hawkins & Cornell 2008, Berryman 1999). En los cultivos tenemos una diversidad de problemas por resolver, desde qué pasa con los pequeños microorganismos del suelo y su impacto en estos, hasta qué factores influyen en el rendimiento de las cosechas. Para esto debemos utilizar toda la información disponible y digitalizarla sistemáticamente o empezar a recolectarla para poder analizarla a través de modelos que nos ayuden a entender el impacto de los factores climáticos, nutricionales, fisiológicos o de riego que afectan a las plantaciones, para poder explicarlos y predecirlos. Esto con el fin último de brindar al agricultor una herramienta preventiva para evitar pérdidas en su producción y entender a cabalidad su cultivo. Esta es la razón por la que el monitoreo constante y la digitalización de los datos es fundamental para reconstruir la historia y verla con lentes más grandes que puedan representar el ciclo de vida de un cultivo y no una fotografía instantánea. Las plantaciones de uva para vino en Chile tienen una extensión promedio de 40.017 hectáreas (Figura 1) acorde con el Catastro Vitícola Nacional SAG (2019), de las cuales en el 2019 se produjo un billón de litros de vino (Figura 2). Las cifras anteriores establecen la importancia de las plantaciones de vid para el país y como las pérdidas en su producción afectan al producto interno bruto chileno. El uso de ‘data science’ en este tipo de cultivos puede ayudar a mejorar el rendimiento gracias a la implementación de modelos predictivos. Un ejemplo sobre cómo podemos empezar a usar los datos en los cultivos de uva, es el análisis del rendimiento donde lo recomendable es que estos valores sean tomados cada temporada y por cuartel para tener un registro histórico del fundo. En este caso podemos usar la productividad por hectáreas para entender porque disminuye o aumenta a lo largo de los años, pero si además incluimos esta información junto con datos climáticos provenientes de una estación meteorológica cercana podremos identificar los factores que influyen en el rendimiento y así poder predecir las cosechas futuras. Esto nos permite no solo saber cuánta uva para vino se produce al año sino también relacionar los factores climáticos (temperatura, lluvia, humedad,