Asegurar el aprendizaje automático distribuido
¿Qué es el aprendizaje federado?
Como mencionamos en nuestra publicación de blog anterior, una de las aplicaciones más interesantes de la informática confidencial se encuentra en el campo de rápido desarrollo del aprendizaje federado. Dado que este tema es más complejo, sentimos que merecía su propia atención especial. Entonces, ¿qué es exactamente el aprendizaje federado?
También se conoce como aprendizaje automático distribuido. Todos sabemos que cuanto mayor sea el conjunto de datos, más precisos serán los resultados. Sin embargo, en el mundo actual, los datos son literalmente oro digital. El mercado global de big data y analítica empresarial se valoró en 169 mil millones $ en 2018 y se espera que crezca hasta 274 mil millones $ en 2022. Así que, naturalmente, el dilema al que se enfrenta es que todos quieren tener acceso a mejores resultados de análisis de datos, pero no están dispuestos a compartir sus datos. Además, la mayoría de las instituciones se enfrentan a estrictas normativas de protección de datos que restringen aún más su capacidad para compartir datos, ¡incluso si quisieran!
El aprendizaje federado permite que los algoritmos de aprendizaje automático accedan a una amplia gama de conjuntos de datos situados en diferentes ubicaciones. Permite a las empresas (como bancos, aseguradoras, fabricantes, etc.) colaborar en el desarrollo de modelos de datos y acceder a resultados mejorados, pero sin necesidad de compartir directamente datos seguros entre sí. Esto significa que los algoritmos obtienen exposición a muchos más datos de los que cada empresa individual tiene a su disposición. El aprendizaje federado descentraliza el aprendizaje automático al eliminar la necesidad de compartir datos o centralizarlos en una única ubicación.
Modelo de aprendizaje federado © MADANA 2021
Entonces, todos estamos de acuerdo en que el aprendizaje federado es excelente. Es una solución que evita el intercambio de datos, sino que se centra en el intercambio de modelos. Sin embargo, todavía existe el problema con el hecho de que la mayoría de los proveedores de algoritmos están dispuestos a compartir su propia propiedad intelectual con esos terceros. Esto es comprensible, ya que han construido su negocio en torno a sus algoritmos y modelos de aprendizaje automático. Esto, junto con el riesgo que corren los datos cuando están "en uso", presenta un problema importante para esta elegante solución. Aquí es donde entra en juego la informática confidencial.
¿Cómo habilita la informática confidencial el aprendizaje federado?
Como hemos indicado, la informática confidencial protege los datos durante el procesamiento y, cuando se combina con el almacenamiento y el cifrado de red con control exclusivo de las claves de cifrado, proporciona seguridad de datos de extremo a extremo en la nube o en las instalaciones. Aísla los datos confidenciales en un enclave de CPU protegido durante el procesamiento. El contenido del enclave, los datos que se procesan y las técnicas utilizadas para procesarlos, son accesibles solo para el código de programación autorizado, e invisibles e incognoscibles para cualquier otra persona.
El uso de estos enclaves seguros o entornos de ejecución de confianza (TEE) resuelve el problema final en el aprendizaje federado al proteger tanto los datos como los algoritmos propietarios. Si malware u otro código no autorizado intenta acceder a las claves, o si el código autorizado es pirateado o alterado de alguna manera, el TEE niega el acceso a las claves y cancela el cálculo. Esto es exactamente lo que se ofrece a través de MADANA Core.
Aprendizaje federado asegurado por MADANA Core TEE. © MADANA 2021
¿Está interesado en la solución informática confidencial de MADANA? Entonces envíenos un correo electrónico a [email protected]!