<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>deep learning: Noticias, Fotos, Evaluaciones, Precios y Rumores de deep learning • ENTER.CO</title>
	<atom:link href="https://www.enter.co/noticias/deep-learning/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.enter.co/noticias/deep-learning/</link>
	<description>Tecnología y Cultura Digital</description>
	<lastBuildDate>Wed, 28 Feb 2018 15:00:48 +0000</lastBuildDate>
	<language>es</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://www.enter.co/wp-content/uploads/2023/08/Favicon-ENTER.CO_.jpg</url>
	<title>deep learning: Noticias, Fotos, Evaluaciones, Precios y Rumores de deep learning • ENTER.CO</title>
	<link>https://www.enter.co/noticias/deep-learning/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Mira este video musical dirigido por inteligencia artificial</title>
		<link>https://www.enter.co/cultura-digital/el-popurri/video-musical-inteligencia-artificial/</link>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Wed, 28 Feb 2018 13:30:57 +0000</pubDate>
				<category><![CDATA[El Popurrí]]></category>
		<category><![CDATA[deep dream]]></category>
		<category><![CDATA[deep learning]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[inteligencia artificial]]></category>
		<category><![CDATA[música]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=372324</guid>

					<description><![CDATA[¿Quién diría que la inteligencia artificial sería capaz de crear un video musical? Resulta que es posible y que no es un proceso demasiado complicado. Así lo logró un grupo musical llamado Hardcore Anal Hydrogen, que toca música metal, electrónica y electroacústica. Ellos están armando un proyecto de videos musicales usando tecnología de procesamiento de [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>¿Quién diría que la inteligencia artificial <a href="http://www.enter.co/cultura-digital/ciencia/inteligencia-artificial-humanos-pruebas-lectura/" target="_blank">sería capaz de crear </a>un video musical? Resulta que es posible y que no es un proceso demasiado complicado. Así lo logró un grupo musical llamado Hardcore Anal Hydrogen, que toca música metal, electrónica y electroacústica. Ellos están armando un proyecto de videos musicales usando t<a href="http://www.enter.co/cultura-digital/ciencia/inteligencia-artificial/" target="_blank">ecnología de procesamiento de imágenes</a> con inteligencia artificial.<span id="more-372324"></span></p>
<p><img fetchpriority="high" decoding="async" class="alignnone size-large" src="https://i.kinja-img.com/gawker-media/image/upload/c_scale,fl_progressive,q_80,w_800/uui6bdt8htryd6tphlq9.gif" width="800" height="405" /></p>
<p>Ya sea que no te guste el género musical de este grupo, no podemos negar que lo que lograron hacer con imágenes es increíble. Además, Hardcore Anal Hydrogen explicó paso a paso cómo construyó los efectos con inteligencia artificial <a href="http://hardcoreanalhydrogen.com/video-et-intelligence-artificielle/">en su sitio web. </a>Entre las herramientas que usaron encontramos software de inteligencia artificial como Deep Dream. Y también Neural Style Transfer y Optical Flow. Mira aquí el video musical.</p>
<p><iframe title="Hardcore Anal Hydrogen &quot;Jean-Pierre&quot; (2018, Apathia Records)" width="1104" height="621" src="https://www.youtube.com/embed/5WqFqzeLpXg?feature=oembed" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe></p>
<h2>¿Cómo se logra un video artístico con inteligencia artificial?</h2>
<p>El grupo explica en su sitio web que usar inteligencia artificial puede parecer complicado pero que en realidad no lo es. Para usar esta tecnología se requieren dos pasos principales: entrenar y luego aprovechar. Es lo mismo que cuando una persona aprende qué es un objeto. Primero se le muestran muchas imágenes de un mismo objeto,por ejemplo, un árbol. Luego de que aprende, siempre que vea un árbol podrá decir que se trata de ese objeto, incluso si nunca ha visto alguno de ese tipo.</p>
<p>Para el caso de la herramienta Deep Dream, la inteligencia artificial ‘sueña’ algo relacionado sobre una foto que se sube como inspiración. El sistema dibuja imágenes según lo que ha aprendido. Y lo mejor de esta plataforma es que existen modelos entrenados en línea para ser <a href="https://github.com/BVLC/caffe/tree/master/models/bvlc_googlenet">descargados en Github</a>.</p>
<p><img decoding="async" class="aligncenter size-large wp-image-372325" src="https://www.enter.co/wp-content/uploads/2018/02/dream-1024x263.jpg" alt="" width="1024" height="263" srcset="https://www.enter.co/wp-content/uploads/2018/02/dream-1024x263.jpg 1024w, https://www.enter.co/wp-content/uploads/2018/02/dream-300x77.jpg 300w, https://www.enter.co/wp-content/uploads/2018/02/dream-768x197.jpg 768w, https://www.enter.co/wp-content/uploads/2018/02/dream.jpg 1095w" sizes="(max-width: 1024px) 100vw, 1024px" /></p>
<p><em>Imagen: captura de pantalla.</em></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>AWS presentó plataforma y cámara para desarrollar inteligencia artificial</title>
		<link>https://www.enter.co/chips-bits/apps-software/aws-presento-una-plataforma-y-una-camara-para-desarrollar-inteligencia-artificial/</link>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Thu, 30 Nov 2017 14:00:10 +0000</pubDate>
				<category><![CDATA[Apps & Software]]></category>
		<category><![CDATA[Amazon]]></category>
		<category><![CDATA[Amazon Web Services]]></category>
		<category><![CDATA[aprendizaje de máquinas]]></category>
		<category><![CDATA[AWS]]></category>
		<category><![CDATA[deep learning]]></category>
		<category><![CDATA[deep lenses]]></category>
		<category><![CDATA[inteligencia artificial]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=354573</guid>

					<description><![CDATA[Durante el discurso de apertura del congreso anual de AWS, re:Invent, la compañía anunció cinco nuevos servicios de ‘machine learning’ (aprendizaje automatizado) y una cámara habilitada con ‘deep learning’ para desarrolladores. Andy Jassy, CEO de AWS, presentó estos nuevos servicios y explicó que la gran intención detrás de ellos es hacer de la inteligencia artificial [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>Durante el discurso de <a href="http://www.enter.co/chips-bits/apps-software/aws-reinvent/" target="_blank">apertura del congreso anual</a> de AWS, re:Invent, la compañía anunció cinco<a href="http://www.enter.co/chips-bits/apps-software/aws-lanzo-una-plataforma-para-crear-apps-en-vr-y-ar-en-pocas-horas/" target="_blank"> nuevos servicios </a>de ‘machine learning’ (aprendizaje automatizado) y una cámara habilitada con ‘deep learning’ para desarrolladores.</p>
<p>Andy Jassy, CEO de AWS, presentó estos nuevos servicios y explicó que la gran intención detrás de ellos es hacer de la inteligencia artificial una tecnología accesible a la mayor cantidad de personas posible, no solo a desarrolladores especializados.<span id="more-354573"></span></p>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-354593" src="https://www.enter.co/wp-content/uploads/2017/11/Andy_Jassy_CEO_AWS-1024x768.jpg" alt="aws" width="1024" height="768" />Para eso, se lanzó la plataforma SageMaker, un servicio pensado para desarrolladores y científicos de datos. Con ella, se pueden construir, desplegar y administrar rápidamente, modelos propios de ‘machine learning’. La compañía también presentó la cámara DeepLens, que ejecuta modelos de visión de computación en tiempo real.</p>
<p>Además, se lanzaron cuatro nuevos servicios de aplicación. Uno que permite transcribir audio a textos (Amazon Transcribe) y otro para traducir textos a otros idiomas (Amazon Translate). En tercer lugar, se presentó el servicio Amazon Rekognition Video, con el que se pueden analizar videos en tiempo real. Y finalmente, Amazon Comprehend, que permite entender lenguaje natural.</p>
<h2>SageMaker, la llave para el aprendizaje de máquinas</h2>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-354578" src="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM1-1024x768.jpeg" alt="AWS" width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM1-1024x768.jpeg 1024w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM1-300x225.jpeg 300w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM1-768x576.jpeg 768w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM1.jpeg 1040w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p>Hoy en día, el proceso para implementar ‘machine learning’ es bastante complejo y se necesitan habilidades y conocimientos especializados. Incluso los modelos más simples requieren grandes cantidades de tiempo para ser entrenados y desplegados. Además, las compañías deben contratar varios equipos dedicados únicamente a desarrollar y administrar las máquinas. “Hasta el momento, el aprendizaje automático ha estado fuera del alcance de la mayoría de desarrolladores”, dijo Jassy.</p>
<p>Es por eso que AWS decidió hacer SageMaker, un servicio que le quita el trabajo pesado a los desarrolladores. La plataforma hace que construir modelos de ‘machine learning’ sea más fácil, porque ofrece catálogos prefabricados, algoritmos optimizados y mucha asistencia para desplegar un sistema de aprendizaje de máquinas.</p>
<p>“Nuestra visión original para AWS es permitir que cualquier persona en su habitación o garaje pueda tener acceso a la misma tecnología, herramientas, escalabilidad e infraestructura, que las grandes compañías en el mundo. Y nuestra visión para aprendizaje de máquinas no es distinta”, dijo Swami Sivasubramanian, vicepresidente de ‘machine learning’ de AWS. Con esta herramienta, cualquier desarrollador en el mundo puede desplegar una solución con aprendizaje de máquinas, dice la compañía.</p>
<h2>DeepLens, un hardware de inteligencia artificial</h2>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-354580" src="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM-1024x768.jpeg" alt="AWS" width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM-1024x768.jpeg 1024w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM-300x225.jpeg 300w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM-768x576.jpeg 768w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.44-PM.jpeg 1040w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p>AWS ha lanzado hardware en ocasiones anteriores, <a href="https://aws.amazon.com/snowmobile/">como su Snowmobile, </a>un servicio de transferencia de grandes cantidades de datos. Y este año también se esperaba otra pieza tangible de productos de AWS, pero la diferencia es que se anunció por primera un producto relacionado con inteligencia artificial. Se trata de la cámara DeepLens, diseñada para ayudar a los desarrolladores a tener una experiencia física en construir, entrenar y desplegar modelos. Esto se logra al emparejar el dispositivo con los modelos de aprendizaje de máquinas que se pueden construir con SageMaker.</p>
<p><img loading="lazy" decoding="async" class="aligncenter size-full wp-image-354583" src="https://www.enter.co/wp-content/uploads/2017/11/cam.png" alt="" width="630" height="362" srcset="https://www.enter.co/wp-content/uploads/2017/11/cam.png 630w, https://www.enter.co/wp-content/uploads/2017/11/cam-300x172.png 300w" sizes="auto, (max-width: 630px) 100vw, 630px" /></p>
<p>¿Qué cosas se pueden hacer con esta cámara? La idea con DeepLens es que los desarrolladores puedan hacer lo que su creatividad les dicte. El sistema se empareja con los modelos de aprendizaje realizados con Sagemaker, y otras plataformas como TensorFlow.</p>
<p>Así, se pueden detectar y reconocer objetos, como clasificar comida o animales, por ejemplo. También tiene reconocimiento facial, y puede reconocer una actividad como lavarse los dientes o tomar una bebida. Matt Wood, gerente general de inteligencia artificial de AWS, nos mostró un ejemplo de las capacidades de la cámara. Mostró un álbum en físico a la cámara y sonrió. La cámara inmediatamente conoció que era ‘The Dark Side of the Moon’ de Pink Floyd. Además, reconoció que la cara de Wood tenía una expresión positiva, porque estaba sonriendo.</p>
<p>Deep Lens estará disponible para preórdenes desde comienzos de 2018, y costará 249 dólares en Amazon.</p>
<h2>Aplicaciones con inteligencia artificial</h2>
<p>Jassy explicó en su discurso que para los desarrolladores que no quieren construir sus modelos de aprendizaje, pero que de todas formas están interesados en usar tecnologías de inteligencia artificial; están las aplicaciones. En esta ocasión la compañía presentó cuatro nuevos servicios: Amazon Transcribe, Amazon Translate, Amazon Comprehend y Amazon Rekognition Video.</p>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-354577" src="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM2-1024x768.jpeg" alt="AWS" width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM2-1024x768.jpeg 1024w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM2-300x225.jpeg 300w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM2-768x576.jpeg 768w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM2.jpeg 1040w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p>Amazon Transcribe convierte audios en texto. Y, a diferencia de varios productos en el mercado, arroja textos precisos y con puntuación completa. Es capaz de reconocer varias personas hablando en el audio y, hasta el momento, está disponible en español e inglés únicamente. Por su parte, Amazon Translate, usa técnicas de ‘redes neuronales’ para traducir textos de un idioma a otro, y hasta el momento soporta siete idiomas: inglés, árabe, francés, alemán, portugués, chino y español.</p>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-354586" src="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM3-1024x768.jpeg" alt="aws" width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM3-1024x768.jpeg 1024w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM3-300x225.jpeg 300w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM3-768x576.jpeg 768w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM3.jpeg 1040w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p>Amazon Comprehend, otra de las aplicaciones presentadas, puede entender textos que están en documentos, publicaciones de redes sociales o cualquier otro dato textual almacenado en AWS. El sistema usa técnicas de ‘deep learning’ para identificar personas, lugares, fechas, organizaciones, marcas, entre otros. También puede identificar los sentimientos expresados en el texto, frases clave, conceptos y adjetivos. Este servicio permite reconocer cómo se sienten los usuarios frente a un producto, o un sitio web, por ejemplo.</p>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-354584" src="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM1-1024x768.jpeg" alt="aws" width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM1-1024x768.jpeg 1024w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM1-300x225.jpeg 300w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM1-768x576.jpeg 768w, https://www.enter.co/wp-content/uploads/2017/11/WhatsApp-Image-2017-11-29-at-2.29.43-PM1.jpeg 1040w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p>Finalmente, Amazon Rekognition Video, es capaz de identificar personas, actividades, objetos, rostros, celebridades, contenidos inapropiados, dentro del contenido de millones de videos. Provee reconocimiento facial en tiempo real entre millones de rostros en videos en tiempo real. El sistema puede catalogar con etiquetas secciones específicas de los videos, según ubicaciones, actividades, por ejemplo. Este servicio puede ser útil para agencias de seguridad, que quieren seguir a personas de interés para ellos.</p>
<p><em>Imágenes: ENTER.CO y Amazon.</em></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Esta herramienta gratuita hace transcripciones de audio en inglés</title>
		<link>https://www.enter.co/chips-bits/apps-software/esta-herramienta-de-transcripcion-de-audio-es-gratis-desde-hoy/</link>
					<comments>https://www.enter.co/chips-bits/apps-software/esta-herramienta-de-transcripcion-de-audio-es-gratis-desde-hoy/#comments</comments>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Tue, 10 Oct 2017 21:59:46 +0000</pubDate>
				<category><![CDATA[Apps & Software]]></category>
		<category><![CDATA[ai]]></category>
		<category><![CDATA[aprendizaje de máquinas]]></category>
		<category><![CDATA[deep learning]]></category>
		<category><![CDATA[deepgram]]></category>
		<category><![CDATA[herramienta de transcripción]]></category>
		<category><![CDATA[inteligencia artificial]]></category>
		<category><![CDATA[transcripción automática]]></category>
		<category><![CDATA[transcripción gratis]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=342795</guid>

					<description><![CDATA[Deepgram, una herramienta para transcribir audios a texto, es gratis para todos a partir de hoy. Esta plataforma funciona aplicando aprendizaje de máquinas a datos de audio, según reportó TechCrunch. Ya no tendremos que pasar horas eternas transcribiendo audios a texto, o pagar servicios costosos como el de Trint (que cuesta desde 12 dólares la [&#8230;]]]></description>
										<content:encoded><![CDATA[<figure id="attachment_342818" aria-describedby="caption-attachment-342818" style="width: 1024px" class="wp-caption aligncenter"><img loading="lazy" decoding="async" class="size-large wp-image-342818" src="https://www.enter.co/wp-content/uploads/2017/10/audio-1024x768.jpg" alt="imagen transcripción" width="1024" height="768" /><figcaption id="caption-attachment-342818" class="wp-caption-text">Con Deepgram, las horas de transcripción se convierten en segundos.</figcaption></figure>
<p><a href="https://deepgram.com">Deepgram</a>, una herramienta para transcribir audios a texto, es gratis para todos a partir de hoy. Esta plataforma funciona <a href="http://www.enter.co/chips-bits/apps-software/google-4/" target="_blank">aplicando aprendizaje de máquinas</a> a datos de audio, <a href="https://techcrunch.com/2017/10/10/deepgram-opens-up-its-machine-transcription-platform-to-everyone/?ncid=rss" target="_blank">según reportó TechCrunch</a>. Ya no tendremos que pasar horas eternas transcribiendo audios a texto, o pagar servicios costosos como el de <a href="https://trint.com/">Trint</a> (que cuesta desde 12 dólares la hora).<span id="more-342795"></span></p>
<p>Aunque la plataforma solo funciona para audios en inglés, es una herramienta útil para muchas labores de estudio o de trabajo. Por ejemplo, puedes transcribir en segundos, una entrevista, o el audio de un discurso para hacer un estudio académico.</p>
<p>Deepgram te permite subir un audio que tengas guardado en tu computador, o incluso pegar un enlace de un video de YouTube. Dependiendo del peso del archivo, el sistema se demora unos cuantos segundos procesando el audio. Luego te muestra el texto que logró captar, dividido en cada minuto de la duración.</p>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-342809" src="https://www.enter.co/wp-content/uploads/2017/10/deep2-1024x477.jpg" alt="" width="1024" height="477" srcset="https://www.enter.co/wp-content/uploads/2017/10/deep2-1024x477.jpg 1024w, https://www.enter.co/wp-content/uploads/2017/10/deep2-300x140.jpg 300w, https://www.enter.co/wp-content/uploads/2017/10/deep2-768x358.jpg 768w, https://www.enter.co/wp-content/uploads/2017/10/deep2.jpg 1307w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p>La plataforma usa ‘<a href="http://www.enter.co/cultura-digital/ciencia/inteligencia-artificial/" target="_blank">deep learning’, una especie más compleja</a> de <a href="http://www.enter.co/chips-bits/apps-software/google-4/" target="_blank">aprendizaje de máquinas</a>, que funciona con redes neuronales (similar al funcionamiento del cerebro). Eso quiere decir que los desarrolladores han estado ‘entrenando’ al sistema con palabras en inglés para que sea capaz de reconocerlas y ponerlas en texto. Es por eso que Deepgram solo funciona para audios en inglés.</p>
<h2>¿Cómo quedan las transcripciones?</h2>
<p>La versión gratis es muy rústica. Eso quiere decir que no asimila signos de puntuación y ciertos términos, como marcas o productos. Para que el sistema logre esas particularidades, sí tocaría pagar una mensualidad. Pero ¿qué es poner un par de puntos y comas en comparación con horas de transcripción?</p>
<p>Otras limitaciones de la plataforma tienen que ver con los tonos de las voces. Estuvimos probando con algunos audios y para el caso de las canciones, el sistema no es muy hábil a la hora de reconocer la ‘letra’.</p>
<p>Tampoco parece captar discursos con un tono artístico. Por ejemplo, intentamos con un fragmento del famoso discurso ‘Yo tengo un sueño’ de Martin Luther King, pero el sistema no reconoció más que un par de frases de un audio de dos minutos.</p>
<p>En cambio, subimos un audio de una entrevista a Barack Obama con Ellen Degeneres. El tono es más convencional y el audio es limpio. Por lo tanto, la transcripción salió tal como esperábamos:</p>
<p><img loading="lazy" decoding="async" class="aligncenter size-large wp-image-342808" src="https://www.enter.co/wp-content/uploads/2017/10/deep1-1024x513.jpg" alt="" width="1024" height="513" srcset="https://www.enter.co/wp-content/uploads/2017/10/deep1-1024x513.jpg 1024w, https://www.enter.co/wp-content/uploads/2017/10/deep1-300x150.jpg 300w, https://www.enter.co/wp-content/uploads/2017/10/deep1-768x385.jpg 768w, https://www.enter.co/wp-content/uploads/2017/10/deep1.jpg 1255w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<h2>¿Cómo funciona la plataforma?</h2>
<p>Deepgram tiene un navegador que te permite buscar palabras clave. Esto es particularmente útil para transcripciones largas. El reporte de TechCrunch dice que el sistema es hábil a la hora de buscar dentro del texto. Por ejemplo, en una entrevista de una hora, el periodista dice que solo le tomó dos intentos encontrar el segmento del diálogo que estaba buscando.</p>
<p>“La ASR [reconocimiento autómata de voz] aún no está resuelta&#8230; está lista para sets específicos de datos pero con datos con acentos o ruidosos, cualquier servicio hará un mal trabajo”, le dijo al medio Scott Stephenson, cofundador y CEO de Deepgram. Vale la pena decir que en una de mis pruebas, subí el audio de una entrevista en la que hablo en inglés, con un acento latino moderado, y reconoció mis palabras a la perfección.</p>
<p>Finalmente, la oferta gratis tiene un límite: si usas más de un millón de minutos, te comenzarán a cobrar. La computación es costosa, así que tendría sentido cobrar si pones a un sistema a procesar un archivo de audio de 50 terabytes.</p>
<p><em>Imágenes: capturas de pantalla y Wikipedia.</em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://www.enter.co/chips-bits/apps-software/esta-herramienta-de-transcripcion-de-audio-es-gratis-desde-hoy/feed/</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
		<item>
		<title>El MIT creó una máquina de produce pesadillas con AI</title>
		<link>https://www.enter.co/cultura-digital/ciencia/el-mit-creo-una-maquina-de-produce-pesadillas-con-ai/</link>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Mon, 31 Oct 2016 20:33:20 +0000</pubDate>
				<category><![CDATA[Ciencia]]></category>
		<category><![CDATA[algoritmos]]></category>
		<category><![CDATA[deep learning]]></category>
		<category><![CDATA[halloween]]></category>
		<category><![CDATA[inteligencia artificial]]></category>
		<category><![CDATA[máquina de pesadillas]]></category>
		<category><![CDATA[MIT]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=266716</guid>

					<description><![CDATA[Justo para la celebración de Halloween, el MIT presentó su Máquina de Pesadillas (Nightmare Machine), que está diseñada para estudiar las imágenes y situaciones que nos dan miedo. El sistema usa inteligencia artificial para generar imágenes miedosas, según explicó la Commonwealth Scientific and Industrial Research Organization (CSIRO), aliada del MIT para este proyecto, en una [&#8230;]]]></description>
										<content:encoded><![CDATA[<figure id="attachment_266723" aria-describedby="caption-attachment-266723" style="width: 1024px" class="wp-caption aligncenter"><img loading="lazy" decoding="async" class="size-full wp-image-266723" src="https://www.enter.co/wp-content/uploads/2016/10/paris_frightnight.jpg" alt="La ciencia al servicio del terror. " width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2016/10/paris_frightnight.jpg 1024w, https://www.enter.co/wp-content/uploads/2016/10/paris_frightnight-300x225.jpg 300w, https://www.enter.co/wp-content/uploads/2016/10/paris_frightnight-768x576.jpg 768w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /><figcaption id="caption-attachment-266723" class="wp-caption-text">La ciencia al servicio del terror.</figcaption></figure>
<p><span style="font-weight: 400;">Justo para la celebración de Halloween, el MIT </span><a href="http://nightmare.mit.edu/#portfolioModal28"><span style="font-weight: 400;">presentó su Máquina de Pesadillas </span></a><span style="font-weight: 400;">(Nightmare Machine), que está diseñada para estudiar las imágenes y situaciones que nos dan miedo.<a href="http://www.enter.co/cultura-digital/autotecnologia/el-mit-quiere-que-los-carros-autonomos-decidan-como-los-humanos/" target="_blank"> El sistema usa inteligencia artificial </a>para generar imágenes miedosas, según explicó la Commonwealth Scientific and Industrial Research Organization (CSIRO), aliada del MIT para este proyecto, </span><a href="https://blog.csiro.au/the-nightmare-machine/"><span style="font-weight: 400;">en una publicación de blog.</span></a><span id="more-266716"></span></p>
<p><span style="font-weight: 400;">¿Cuál es el objetivo de la Máquina de Pesadillas? Todos le tenemos miedo a algo, ya sean payasos, hablar en público, las arañas o al dentista. Pero algunos estímulos, racionales o irracionales, evocan distintas respuestas psicológicas, así que el MIT y la Csiro quieren estudiar las características físicas que caras y lugares que nos dan miedo,</span><a href="http://www.pcmag.com/news/349181/happy-halloween-heres-an-ai-powered-nightmare-machine"><span style="font-weight: 400;"> informó PCMagazine</span></a><span style="font-weight: 400;">. </span></p>
<p><span style="font-weight: 400;">La Máquina de Pesadillas fue desarrollada por los equipos de los laboratorios Data61 y Media Lab del MIT. Se usan dos algoritmos de ‘deep learning’ (aprendizaje de máquinas) para transformar escenarios bellos y comunes, como el Taj Mahal o un catálogo de muebles, en un matadero o una casa embrujada. </span></p>
<p><span style="font-weight: 400;">En primer lugar, <a href="http://www.enter.co/cultura-digital/autotecnologia/mit-propone-reemplazar-los-semaforos-por-algoritmos/" target="_blank">los algoritmos examinan</a> casas embrujadas, pueblos fantasma y ciudades ‘tóxicas’, y luego aplican el estilo que aprenden de esas escenas a lugares famosos, como el Coliseo en Roma o el puente Golden Gate. El algoritmo es capaz de extraer los elementos ‘miedosos’ de las muestras y plantarlos en esos lugares para que asusten.</span></p>
<p>Los investigadores están motivando al público para que vayan al sitio y califiquen las imágenes según su factor de ‘terror’. Cada clic genera más datos para que los algoritmos aprendan. El equipo ha recolectado más de 200.000 evaluaciones individuales de las imágenes generadas a computador.</p>
<p><a href="http://nightmare.mit.edu/#portfolioModal28"><span style="font-weight: 400;">Si entras al sitio web</span></a><span style="font-weight: 400;">, el sistema te pide en primer lugar que califiques 10 fotos de caras ‘modificadas’ como ‘scary’ o ‘not scary’ (miedosa o no miedosa). La idea es que el algoritmo aprenda qué tipo de caras dan más miedo que otras. Al final de la prueba recibes un ‘collage’ de imágenes modificadas que puedes compartir en Twitter.</span></p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-266720 size-large" src="https://www.enter.co/wp-content/uploads/2016/10/mit-1024x552.jpg" alt="mit" width="1024" height="552" srcset="https://www.enter.co/wp-content/uploads/2016/10/mit-1024x552.jpg 1024w, https://www.enter.co/wp-content/uploads/2016/10/mit-300x162.jpg 300w, https://www.enter.co/wp-content/uploads/2016/10/mit-768x414.jpg 768w, https://www.enter.co/wp-content/uploads/2016/10/mit.jpg 1205w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p><span style="font-weight: 400;">Y en segundo lugar, el sistema de muestra cómo su algoritmo es capaz de modificar lugares emblemáticos en escenarios de terror. Hay distintos ‘temas’ de terror que se aplican a sitios famosos alrededor del mundo. Por ejemplo, está el tema de casa embrujada, o de ‘Noche Estrellada’ de la obra de Van Gogh, o de matadero o de pueblo fantasma. Si haces clic en las imágenes puedes ver la foto original y cómo el sistema la convirtió en un escenario terrorífico. </span></p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-266721 size-large" src="https://www.enter.co/wp-content/uploads/2016/10/mit2-1024x494.jpg" alt="mit2" width="1024" height="494" srcset="https://www.enter.co/wp-content/uploads/2016/10/mit2-1024x494.jpg 1024w, https://www.enter.co/wp-content/uploads/2016/10/mit2-300x145.jpg 300w, https://www.enter.co/wp-content/uploads/2016/10/mit2-768x371.jpg 768w, https://www.enter.co/wp-content/uploads/2016/10/mit2.jpg 1187w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></p>
<p><em>Imágenes: capturas de pantalla. </em></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Hormiga virtual de Google hace goles aunque no sepa jugar fútbol</title>
		<link>https://www.enter.co/chips-bits/apps-software/google-le-enseno-a-una-hormiga-virtual-a-jugar-futbol/</link>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Mon, 20 Jun 2016 18:10:32 +0000</pubDate>
				<category><![CDATA[Apps & Software]]></category>
		<category><![CDATA[deep learning]]></category>
		<category><![CDATA[google DeepMind]]></category>
		<category><![CDATA[inteligencia artificial de google]]></category>
		<category><![CDATA[reinforced learning]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=251587</guid>

					<description><![CDATA[DeepMind, el laboratorio de inteligencia artificial de Google, presentó el pasado viernes 17 de junio una actualización de sus más recientes logros en aprendizaje de máquinas.  Dentro de los avances de AI de Google está un experimento en el que lograron entrenar a una hormiga virtual para que juegue fútbol, según informó VentureBeat.  Mediante una publicación [&#8230;]]]></description>
										<content:encoded><![CDATA[<figure id="attachment_251593" aria-describedby="caption-attachment-251593" style="width: 1024px" class="wp-caption aligncenter"><img loading="lazy" decoding="async" class="size-full wp-image-251593" src="https://www.enter.co/wp-content/uploads/2016/06/ant.jpg" alt="Google puede enseñarle a sus máquinas a jugar videojuegos sin haberles leído las instrucciones. " width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2016/06/ant.jpg 1024w, https://www.enter.co/wp-content/uploads/2016/06/ant-300x225.jpg 300w, https://www.enter.co/wp-content/uploads/2016/06/ant-768x576.jpg 768w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /><figcaption id="caption-attachment-251593" class="wp-caption-text">Google puede enseñarle a sus máquinas a jugar videojuegos sin haberles leído las instrucciones.</figcaption></figure>
<p><span style="font-weight: 400;">DeepMind, el<a href="http://www.enter.co/cultura-digital/ciencia/google-estudia-como-apagar-los-sistemas-de-ai/" target="_blank"> laboratorio de inteligencia artificial de Google</a>, presentó el pasado viernes 17 de junio una actualización de sus más <a href="http://www.enter.co/especiales/videojuegos/google-logra-que-la-inteligencia-artificial-domine-juegos-clasicos/" target="_blank">recientes logros en aprendizaje de máquinas</a>.  Dentro de los avances de AI de Google está un experimento en el que lograron entrenar a una hormiga virtual para que juegue fútbol, <a href="http://venturebeat.com/2016/06/17/google-deepmind-ant-soccer/" target="_blank">según informó VentureBeat</a>. </span><span id="more-251587"></span></p>
<p><span style="font-weight: 400;">Mediante <a href="https://deepmind.com/blog" target="_blank">una publicación en el blog del laboratorio</a>, David Silver explicó los más recientes avances de la tecnología de AI de Google, dentro de los que está un algoritmo avanzado que permite a una hormiga virtual jugar fútbol sin ningún conocimiento previo del deporte.</span></p>
<p><span style="line-height: 1.5;"><a href="http://www.enter.co/chips-bits/apps-software/mira-a-la-inteligencia-artificial-de-google-resolviendo-laberintos/" target="_blank">DeepMind usa un sistema llamado ‘aprendizaje de reforzamiento’</a> (RL) que consiste en aprender por prueba y error a través de recompensas o castigos. Junto a RL también se usa ‘deep learning’, que consiste en entrenar redes neuronales artificiales con mucha información para que luego el sistema haga inferencias propias y produzca nueva información.</span></p>
<p><span style="font-weight: 400;">Con RL, y sus evoluciones, Google ha logrado que sus agentes jueguen videojuegos con la misma capacidad de un humano y sin necesidad de entrenarlos en las dinámicas de los juegos, sino en habilidades de solución de problemas y de recibir recompensas.</span></p>
<p><span style="font-weight: 400;">Google ha logrado que sus máquinas jueguen igual que un humano e incluso son capaces de ganarles en juegos de estrategia. Google tiene un programa <a href="http://www.enter.co/chips-bits/apps-software/alphago-logra-otra-estrella-entre-la-batalla-entre-ai-y-los-humanos/" target="_blank">llamado AlphaGo</a>, con el que se le enseñó a un agente de AI a jugar un juego llamado ‘Go’, un juego chino antiguo parecido al ajedrez. <a href="http://www.enter.co/chips-bits/apps-software/alphago-logra-otra-estrella-entre-la-batalla-entre-ai-y-los-humanos/" target="_blank">Hace unos meses Google enfrentó a AlphaGo</a> con el mejor jugador de ‘Go’ del mundo, </span><span style="font-weight: 400;">Lee Se-dol y le ganó. El sistema mezcla una red neuronal y un árbol de decisión para saber cómo moverse en el juego. Pero antes el programa había analizado las partidas de los mejores jugadores del mundo para aprender a jugar. </span></p>
<p><iframe loading="lazy" title="Ant Soccer" width="1104" height="621" src="https://www.youtube.com/embed/XTAx-DwAHp4?feature=oembed" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe></p>
<p>Para entender mejor cómo hace esta hormiga deportista, es necesario hacer un pequeño repaso de lo que ha hecho hasta el momento Google en AI.</p>
<h2><span style="font-weight: 400;">Aprender a comportarse </span></h2>
<p><span style="font-weight: 400;">Los agentes de AI de DeepMind deben realizar juicios constantemente para seleccionar buenas acciones sobre las incorrectas. Ese conocimiento se representa a través de un algoritmo llamado ‘Q-network’ que estima la recompensa total que un agente espera recibir luego de ejecutar una acción determinada. </span></p>
<p><span style="font-weight: 400;">Hace dos años el laboratorio presentó el primero de estos algoritmos de RL. La idea era combinar los algoritmos de ‘Q-network’ con redes neuronales artificiales. Las redes neuronales artificiales son sistemas que simulan la forma en que funcionan las neuronas de los seres vivos. </span></p>
<p><span style="font-weight: 400;">Los intentos anteriores de combinar estos dos sistemas presentaron algunos inconvenientes, como aprendizaje inconstante. Para solucionar estas inestabilidades, los algoritmos ‘Deep Q-Networks’ de Google (DQN) almacena todas las experiencias de entrenamiento del agente de AI y después toma muestras al azar de ellas. Luego las reproduce de forma aleatoria para que el agente obtenga información diversa de entrenamiento. </span></p>
<h2>La ‘máquina’ gana</h2>
<p><span style="font-weight: 400;">Luego de hacer este entrenamiento, Google aplicó el DQN para que el agente aprendiera a jugar videojuegos en la consola Atari 2600. El sistema observa los pixeles que componen el juego en la pantalla, luego correlaciona esa información con los datos que previos de la recompensa que le genera cierto puntaje adquirido dentro del juego. A partir de esa correlación selecciona qué hacer en el videojuego. </span></p>
<p><span style="font-weight: 400;"><a href="https://storage.googleapis.com/deepmind-data/assets/papers/DeepMindNature14236Paper.pdf" target="_blank">A través de un reporte</a>, Google demostró que pudo entrenar varios agentes con DQN para que jugaran 50 juegos diferentes sin tener ningún conocimiento previo del juego como tal. Incluso el sistema logró un desempeño parecido al de un humano en casi la mitad de los juegos.</span></p>
<p><span style="font-weight: 400;">Con estos algoritmos Google construyó un sistema masivo de RL que llamaron Gorila, que usa la plataforma de Google Cloud para acelerar el tiempo de entrenamiento de los agentes de AI. Gorila se ha aplicado a algunos sistemas dentro de Google. </span></p>
<h2><span style="font-weight: 400;">‘Multitasking’ en su máxima expresión</span></h2>
<p><span style="font-weight: 400;">Google no se conformó con Gorila para seguir desarrollando su método de aprendizaje por recompensas.  Así que recientemente presentó otro método que es más práctico y efectivo basados en órdenes asincrónicas de RL. La idea es que el agente de AI pueda ejecutar varias acciones en pararelo. Esto provee una alternativa para que los agentes solucionen mejor los problemas que se presentan en videojuegos. </span></p>
<p><span style="font-weight: 400;">El algoritmo asincrónicas, llamado A3C, combina algunos algoritmos de ‘Q-network’ con la tecnología de ‘deep learning’ para seleccionar las mejores acciones, es decir las que le den mejores recompensas al agente. La diferencia es que necesita muy poco tiempo de entrenamiento, comparado con DQN, y muchos menos recursos de energía de los que usa Gorila. </span></p>
<p><span style="font-weight: 400;"><a href="http://www.enter.co/chips-bits/apps-software/mira-a-la-inteligencia-artificial-de-google-resolviendo-laberintos/" target="_blank">Con A3C Google lanzó Labyrinth</a>, una suite de navegación en 3D de laberintos y juegos de rompecabezas. Los agentes son capaces de resolver estos juegos con la mismo rendimiento que un humano. El mismo algoritmo de Labyrinth le permite a la hormiga meter goles sin necesidad de haber entrenado al agente para jugar fútbol. El agente solo necesita saber qué acciones le darán más recompensas. Para eso, el agente también crea un sistema de estrategias que le permiten ejecutar varias acciones al tiempo, y junto a una estrategia de prioridades dentro del juego, la hormiga no falla ningún tiro al arco. </span></p>
<p><iframe loading="lazy" title="Asynchronous Methods for Deep Reinforcement Learning: Labyrinth" width="1104" height="828" src="https://www.youtube.com/embed/nMR5mjCFZCw?feature=oembed" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe></p>
<p><em>Imagen: captura de pantalla. </em></p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
