Identificar minerales en meteoritos con aprendizaje automático

El pasado fin de semana, el Museo Americano de Historia Natural (AMNH) organizó su quinto hackathon anual. El tema de este año fue “Hackear el sistema solar”. Mi equipo trabajó en un proyecto para identificar y mapear la composición mineral de los meteoritos.

Comprender la composición mineral de los meteoritos puede enseñarnos sobre el sistema solar. Cuando provienen de cuerpos interplanetarios (como los asteroides), podemos aprender cómo se formó el sistema solar hace 4.500 millones de años.

Los meteoritos pueden incluso provenir de otros planetas, lo que nos permite estudiarlos a millones de kilómetros de distancia.

Química 101

Los átomos son ​​los objetos diminutos que componen la materia. Los átomos consisten en un núcleo de protones y neutrones en el centro rodeado de electrones. El número de protones en el núcleo define qué elemento es ese átomo. Por ejemplo, el hidrógeno, el elemento más ligero, tiene 1 protón; el oxígeno tiene 8 y el hierro tiene 26.

Las moléculas están compuestas por múltiples átomos unidos entre sí. Por ejemplo, una molécula de agua está formada por 2 átomos de hidrógeno y 1 átomo de oxígeno. Esto se puede escribir como una fórmula química como H₂O.

Los minerales son ​​grupos de moléculas sólidas como los diamantes, el cuarzo o el topacio. Los átomos pueden unirse en una gran variedad de formas para formar minerales muy diferentes. Solo hay 118 elementos conocidos, pero juntos componen 3800 minerales .

Algunas fórmulas minerales pueden ser bastante complejas, como el topacio: Al₂SiO₄ (OH, F) ₂ – 2 aluminio, 1 silicio, 4 oxígeno y 2 oxígeno + hidrógeno o 2 flúor. Mientras que las fórmulas para otros pueden ser bastante simples. La fórmula para el diamante es C – solo carbono.

Pero, la estructura de los átomos es muy importante también. Los diamantes y el grafito (el material en su lápiz) están compuestos de carbono, pero son muy diferentes porque los átomos de carbono están unidos de diferentes maneras.

La estructura química de los diamantes frente al grafito. ( http://www.jidonline.com/viewimage.asp?img=JInterdiscipDentistry_2011_1_2_93_85026_f3.jpg )

Cómo se estudian los meteoritos

Los científicos exploran los meteoritos utilizando una microscopia electrónica (EMP). Un EMP dispara un haz de electrones al meteorito. Cuando el haz de electrones choca con los átomos en el meteorito, los átomos emiten rayos x. Cada elemento tiene una frecuencia característica distinta.

Un gráfico de frecuencias características de elementos diferentes. ( https://commons.wikimedia.org/wiki/File:XRFScan.jpg )

Antes de iniciar el escaneo, los científicos configuran el EMP para detectar un conjunto específico de elementos. Cuando se emiten los rayos X característicos del elemento deseado, el detector registra la intensidad.

El EMP produce una serie de imágenes en escala de grises, una para cada elemento, donde cada píxel representa la proporción de ese elemento en esa ubicación.

Las 10 imágenes producidas por el EMP al escanear un meteorito en busca de 10 elementos diferentes. Más brillante significa que más de ese elemento está presente en esa ubicación. Los 10 elementos son: Aluminio (Al), Calcio (Ca), Cromo (Cr), Hierro (Fe), Magnesio (Mg), Níquel (Ni), Fósforo (P), Silicio (Si), Azufre (S) y Titanio (Ti).

Esto nos puede decir qué elementos están presentes. Pero, ¿cómo determinamos los minerales?

La intensidad relativa de los rayos X de diferentes elementos corresponde a la proporción relativa de ese elemento en diferentes minerales. Cuanto más presente esté un elemento, más electrones golpearán un átomo de ese elemento y, por lo tanto, emitirán su radiografía característica.

Por ejemplo, el mineral de troilita es aproximadamente 2/3 de hierro y 1/3 de azufre, lo que significa que esperaríamos que 2/3 de los rayos X emitidos sean rayos X característicos del hierro, y 1/3 que sea característico de Azufre.

Pero hay un par de arrugas que lo dificultan. Primero, los resultados pueden ser muy ruidosos, lo que significa que el PMA rara vez dará resultados que coincidan con la proporción del elemento teórico en el mineral.

En segundo lugar, el sensor de cada elemento tiene una escala diferente. Por ejemplo, una lectura de hierro de 400 puede significar 50% de hierro, mientras que una lectura de azufre de 200 puede significar 100% de azufre.

Para controlar esto, los meteoritos se escanean junto con los “estándares”. Los estándares son minerales conocidos que se escanean para Entender el comportamiento de la EMP.

Teníamos 8 minerales estándar, dispuestos en una cuadrícula de 4×2 como se muestra a continuación. Cada cuadrado es el etiquetado con el mineral conocido que se colocó allí. La parte superior es la imagen del escaneo de hierro (Fe), la parte central del escaneo de azufre (S) y la parte inferior del escaneo de níquel (Ni).

Escanea de 3 de los 10 elementos en busca de los minerales estándar conocidos. Cada cuadrado es el etiquetado con el mineral conocido que se colocó allí. La parte superior es la imagen de la exploración de hierro (Fe), la parte central es de la exploración de azufre (S) y la parte inferior de la exploración de níquel (Ni). * SCOlv significa San Carlos Olivine, que no tiene una fórmula química distinta.

Esto debería darte una idea de cómo podemos descubrir los minerales de sus elementos constituyentes. Por ejemplo, el cuadrado de solo Fe es brillante en la exploración de Fe y oscuro para el resto, lo que indica que solo Fe está presente allí. Fe₃O4 y FeS se ven similares en la exploración de Fe, pero FeS también se enciende en la exploración de S.

De manera similar, FeS y NiS se ven similares en la exploración S, pero la exploración de Ni puede ayudar a diferenciarlos. Observe también todas las manchas en las imágenes.

A pesar de que estamos escaneando minerales conocidos, no están dando lecturas completamente consistentes. Tendremos que tener esto en cuenta al tratar de identificar los minerales desconocidos en los meteoritos.

Aprendizaje automático

Ahora tenemos todas las piezas que necesitamos para tratar de resolver este problema. Para resumir, nuestro objetivo final es identificar los minerales dentro de un meteorito.

Para hacer eso, escaneamos el meteorito en una microsonda electrónica que puede indicarnos las proporciones relativas de elementos en cada ubicación en ese meteorito. Al mismo tiempo, escaneamos un conjunto de minerales conocidos llamados estándares para que podamos interpretar correctamente los resultados del EMP.

Mi objetivo es crear un clasificador para los minerales no identificados en nuestro meteorito, pero hasta el momento solo tenemos etiquetado datos para los estándares.

No podemos construir directamente un clasificador de las normas porque si el meteorito tiene minerales que no estaban en las normas, no podremos clasificarlo correctamente.

Pero si tenemos una idea de qué minerales podrían estar en el meteorito, podemos simular esos minerales (los minerales objetivo) y construir un clasificador por encima de eso. Y los estándares pueden ayudarnos con la simulación.

El primer paso es usar los estándares para encontrar el coeficiente que convierte la proporción en peso de un elemento a la intensidad de PEM. Esperamos una relación lineal entre proporción de peso e intensidad.

Por ejemplo, si un mineral es 50% de hierro, esperamos que la intensidad sea el doble de alta que si el mineral fuera 25% de hierro. Esto significa que podemos usar la regresión lineal para encontrar los coeficientes.

A continuación se muestran los resultados de la regresión para cada elemento. Cada blob azul es de un estándar diferente. En teoría, cada mancha azul debe ser un solo punto, pero se extienden debido al ruido en las lecturas.

Incluso con el ruido, se puede ver una relación lineal bastante limpia. Pero, en el caso donde las proporciones esperadas son cercanas, como en el gráfico de Fe, las cosas pueden ser ambiguas.

Los resultados de la regresión lineal para cada elemento. El eje x es la intensidad de los resultados de EMP y el eje y es la proporción en peso teórica de ese elemento en el mineral.

Puedo usar estos resultados para simular los minerales objetivo que estamos buscando. Para simular un mineral, calculamos las proporciones de peso teóricas para cada uno de los elementos del mineral, las convertimos a las intensidades esperadas utilizando los resultados de la regresión y agregamos ruido aleatorio basado en el ruido que encontramos en los estándares.

Simulé cada uno de los objetivos minerales 10,000 veces y divida las muestras en 80% de prueba / 20% de pruebas. Entrené un clasificador de bosques al azar en el conjunto de entrenamiento y el modelo resultante logró una precisión del 96.8% en el conjunto de pruebas.

Resultados

Aplicando ese modelo a las exploraciones de meteoritos, aquí están los resultados:

La composición mineral predicha de un meteorito. Cada color representa un mineral diferente.

Y en un segundo meteorito:

La composición mineral predicha de un meteorito. Cada color representa un mineral diferente.

No tenemos la verdad fundamental para estos meteoritos, por lo que no sabemos qué tan preciso es. ¡Pero los científicos con los que estábamos trabajando dijeron que los resultados iniciales son prometedores!

Conclusiones y próximos pasos

Un gran problema con este enfoque es que los científicos deben saber qué minerales están buscando antes de tiempo. Por lo tanto, parece prometedor para identificar incógnitas conocidas, pero dará clasificaciones falsas para incógnitas desconocidas.

Otro enfoque que mi equipo adoptó para identificar minerales fue usar agrupaciones sin supervisión con DBSCAN . No le dirá exactamente qué es el mineral, pero puede decirle que hay minerales con composiciones elementales similares en el meteorito que podrían representar un mineral distinto.

Pensamos que podría haber una manera de combinar estos enfoques y obtener lo mejor de ambos mundos.

Continuamos trabajando en esto y esperamos que pueda ser algo más que un proyecto hackathon divertido y convertirse una parte útil del juego de herramientas para científicos .

Todo nuestro código se puede encontrar en github . Todavía estamos trabajando en ello, así que las cosas podrían estar cambiando.

Esta página describe el desafío original con más detalle: https://github.com/amnh/HackTheSolarSystem/wiki/ Meteorite-Mineral-Mapping

 

Dejá un comentario