<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>google deep mind: Noticias, Fotos, Evaluaciones, Precios y Rumores de google deep mind • ENTER.CO</title>
	<atom:link href="https://www.enter.co/noticias/google-deep-mind/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.enter.co/noticias/google-deep-mind/</link>
	<description>Tecnología y Cultura Digital</description>
	<lastBuildDate>Wed, 23 Nov 2016 17:38:38 +0000</lastBuildDate>
	<language>es</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://www.enter.co/wp-content/uploads/2023/08/Favicon-ENTER.CO_.jpg</url>
	<title>google deep mind: Noticias, Fotos, Evaluaciones, Precios y Rumores de google deep mind • ENTER.CO</title>
	<link>https://www.enter.co/noticias/google-deep-mind/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>La AI de Google lee los labios mejor que un profesional humano</title>
		<link>https://www.enter.co/chips-bits/apps-software/la-ai-de-google-lee-los-labios-mejor-que-un-profesional-humano/</link>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Wed, 23 Nov 2016 18:03:53 +0000</pubDate>
				<category><![CDATA[Apps & Software]]></category>
		<category><![CDATA[aprendizaje de máquinas]]></category>
		<category><![CDATA[google deep mind]]></category>
		<category><![CDATA[inteligencia artificial de google]]></category>
		<category><![CDATA[lectura de labios]]></category>
		<category><![CDATA[Universidad de Oxford]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=269188</guid>

					<description><![CDATA[Un proyecto entre Google DeepMind (la división de inteligencia artificial de Google) y la Universidad de Oxford aplicó aprendizaje de máquinas a una gran base de datos de programas de la cadena BBC para crear un sistema de lectura de labios que deja a los profesionales en ese campo muy por debajo en cuanto a [&#8230;]]]></description>
										<content:encoded><![CDATA[<figure id="attachment_269193" aria-describedby="caption-attachment-269193" style="width: 1024px" class="wp-caption aligncenter"><img fetchpriority="high" decoding="async" class="size-full wp-image-269193" src="https://www.enter.co/wp-content/uploads/2016/11/micro-1494436_1920.jpg" alt="DeepMind de Google y la Universidad de Oxford lograron este sistema. " width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2016/11/micro-1494436_1920.jpg 1024w, https://www.enter.co/wp-content/uploads/2016/11/micro-1494436_1920-300x225.jpg 300w, https://www.enter.co/wp-content/uploads/2016/11/micro-1494436_1920-768x576.jpg 768w" sizes="(max-width: 1024px) 100vw, 1024px" /><figcaption id="caption-attachment-269193" class="wp-caption-text">DeepMind de Google y la Universidad de Oxford lograron este sistema.</figcaption></figure>
<p><span style="font-weight: 400;">Un proyecto entre Google DeepMind (la <a href="http://www.enter.co/chips-bits/apps-software/escucha-a-la-inteligencia-artificial-de-google-crear-voces-realistas/" target="_blank">división de inteligencia artificial de Google</a>) y la Universidad de Oxford aplicó aprendizaje de máquinas a una gran base de datos de programas de la cadena BBC para crear un sistema de lectura de labios que deja a los profesionales en ese campo muy por debajo en cuanto a eficiencia, <a href="https://www.newscientist.com/article/2113299-googles-deepmind-ai-can-lip-read-tv-shows-better-than-a-pro/" target="_blank">informó New Scientist</a>. </span><span id="more-269188"></span></p>
<p><span style="font-weight: 400;"><a href="http://www.enter.co/cultura-digital/ciencia/con-la-ai-de-google-se-podria-salvar-a-las-vacas-marinas/" target="_blank">El sistema de inteligencia artificial</a> fue entrenado para usar cerca de 5.000 horas de seis distintos programas de televisión, que en total sumaron 118.000 frases. Primero, los investigadores de la Universidad de Oxford y DeepMind entrenaron al sistema con programas que se presentaron entre enero de 2010 y diciembre de 2015. Luego probaron su desempeño para subtitular otros programas que se presentaron entre marzo y septiembre de 2016. Pero tan solo al analizar los labios de las personas el sistema pudo descifrar acertadamente frases completas. </span></p>
<p><span style="font-weight: 400;">El sistema creado por DeepMind y Oxford superó a un lector de labios profesional que intentó descifrar 200 clips seleccionados al azar de la base de datos. El profesional acertó solo el 12,4% de las palabras sin error. Pero el sistema de AI anotó el 46,8% de todas las palabras de la base de datos de marzo a septiembre sin ningún error. Además, la mayoría de los errores eran pequeños, como una ‘s’ faltante al final de una palabra. Con estos resultados, el sistema también supera otros sistemas automáticos de lectura de labios. </span></p>
<p><span style="font-weight: 400;">Hace unas semanas, un sistema parecido de aprendizaje de máquinas, llamado LipNet, también desarrollado en la Universidad de Oxford; superó a los humanos con una base de datos conocida como Grid. Pero Grid solo contiene un vocabulario de 51 palabras únicas, mientras que la base de BBC tenía casi 17.500 palabras únicas, así que era un desafío mucho mayor. Además, la gramática en la base de datos de BBC tenía mucha más diversidad de discurso humano real. </span></p>
<h2><span style="font-weight: 400;">¿Cómo lo hizo Google?</span></h2>
<p><span style="font-weight: 400;">Para que la base de datos de BBC fuera apta para la lectura automática de labios, los clips de videos tuvieron que ser preparados usando aprendizaje de máquinas. Pero surgió un problema porque los hilos de audio y video estaban desfasados en algunas partes hasta un segundo, lo cual hubiera hecho imposible que la AI aprendiera las asociaciones entre las palabras dichas y la forma en que la persona movía sus labios. </span></p>
<p><span style="font-weight: 400;">Pero luego, al asumir que la mayor parte de los videos estaban correctamente sincronizados a su audio, el sistema fue entrenado para identificar los enlaces correctos entre sonidos y formas de la boca. Usando esta información, el sistema descubrió qué tanto de los contenidos estaban desfasados cuando no correspondían, y los alineó automáticamente. </span></p>
<p><span style="font-weight: 400;">Los investigadores dicen que la cuestión ahora es saber para qué usar las capacidades del sistema que crearon. Principalmente el sistema de lectura de labios puede ser usado para que los dispositivos móviles identifiquen mejor lo que les decimos para comandos de voz, y en condiciones difíciles, como un recinto lleno de personas.</span></p>
<p><em><span style="font-weight: 400;">Imagen: Pixabay. </span></em></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Escucha a la inteligencia artificial de Google crear voces realistas</title>
		<link>https://www.enter.co/chips-bits/apps-software/escucha-a-la-inteligencia-artificial-de-google-crear-voces-realistas/</link>
					<comments>https://www.enter.co/chips-bits/apps-software/escucha-a-la-inteligencia-artificial-de-google-crear-voces-realistas/#comments</comments>
		
		<dc:creator><![CDATA[Susana Angulo]]></dc:creator>
		<pubDate>Fri, 09 Sep 2016 20:54:59 +0000</pubDate>
				<category><![CDATA[Apps & Software]]></category>
		<category><![CDATA[convertir texto a voz]]></category>
		<category><![CDATA[google deep mind]]></category>
		<category><![CDATA[inteligencia artificial google]]></category>
		<category><![CDATA[voces reales]]></category>
		<category><![CDATA[wavenet]]></category>
		<guid isPermaLink="false">http://www.enter.co/?p=261125</guid>

					<description><![CDATA[La división de inteligencia artificial de Google, DeepMind, acaba de presentar una maquina que produce las voces humanas más realistas hasta el momento. El sistema, llamado WaveNet, genera voces con tan solo una muestra de voz humana real y crea ondas de audio basado en la muestra, según informó The Verge. Google publicó un reporte [&#8230;]]]></description>
										<content:encoded><![CDATA[<figure id="attachment_261134" aria-describedby="caption-attachment-261134" style="width: 1024px" class="wp-caption aligncenter"><img decoding="async" class="size-full wp-image-261134" src="https://www.enter.co/wp-content/uploads/2016/09/hand-977641_1280.jpg" alt="Las voces creadas en computador suelen sonar artificiales. " width="1024" height="768" srcset="https://www.enter.co/wp-content/uploads/2016/09/hand-977641_1280.jpg 1024w, https://www.enter.co/wp-content/uploads/2016/09/hand-977641_1280-300x225.jpg 300w, https://www.enter.co/wp-content/uploads/2016/09/hand-977641_1280-768x576.jpg 768w" sizes="(max-width: 1024px) 100vw, 1024px" /><figcaption id="caption-attachment-261134" class="wp-caption-text">Las voces creadas en computador suelen sonar artificiales.</figcaption></figure>
<p><span style="font-weight: 400;">La división de<a href="http://www.enter.co/chips-bits/apps-software/google-le-enseno-a-una-hormiga-virtual-a-jugar-futbol/" target="_blank"> inteligencia artificial de Google, DeepMind,</a> acaba de presentar una maquina que produce las voces humanas más realistas hasta el momento. El sistema, llamado WaveNet, genera voces con tan solo una muestra de voz humana real y crea ondas de audio basado en la muestra, </span><a href="http://www.theverge.com/2016/9/9/12860866/google-deepmind-wavenet-ai-text-to-speech-synthesis"><span style="font-weight: 400;">según informó The Verge</span></a><span style="font-weight: 400;">. </span><span id="more-261125"></span></p>
<p><a href="https://deepmind.com/blog/wavenet-generative-model-raw-audio/"><span style="font-weight: 400;">Google publicó un reporte completo</span></a><span style="font-weight: 400;"> y un artículo para el público, junto a muestras de audio de lo que es capaz de hacer su sustema. En todas las pruebas que escuchamos, que están en inglés y en mandarín, WaveNet demuestra que es mucho más realista que otros programas que pasan el texto a sonido, aunque aún no llega a ser completamente igual al discurso humano. Además de las voces, el sistema también puede tocar el piano. </span></p>
<p><span style="font-weight: 400;">Los programas de ‘texto a voz’ cada vez son más importante para la computación porque las personas están necesitando más de bots y asistentes personales con AI, como Siri, Cortana, Alexa y Google Assistant.</span></p>
<p><span style="font-weight: 400;">Sin embargo, cuando le haces una pregunta a Siri o Cortana, estos sistemas responden con grabaciones de una voz humana, reacomodadas y combinadas en pequeñas partes. Este método se conoce como ‘texto a voz’ concatenante. Los resultados son relativamente realistas, pero como explica Google, producir una nueva voz o tono requiere tener a un actor que grabe todos los sonidos posibles para que se guarden en una base de datos. Esta es una muestra de ese tipo de voz.</span></p>
<audio class="wp-audio-shortcode" id="audio-261125-1" preload="none" style="width: 100%;" controls="controls"><source type="audio/wav" src="https://www.enter.co/wp-content/uploads/2016/09/googleconce.wav?_=1" /><a href="https://www.enter.co/wp-content/uploads/2016/09/googleconce.wav">https://www.enter.co/wp-content/uploads/2016/09/googleconce.wav</a></audio>
<p>El método alternativo es el ‘texto a voz’ paramétrico, que consiste en construir voces generadas por computador. Esto se logra usando reglas codificadas basadas en la gramática o en los sonidos vocales. Las voces paramétricas no necesitan materiales base para producir voces, pero los resultados, generalmente, son robóticos y artificiales. Escucha aquí este método.</p>
<audio class="wp-audio-shortcode" id="audio-261125-2" preload="none" style="width: 100%;" controls="controls"><source type="audio/wav" src="https://www.enter.co/wp-content/uploads/2016/09/parametric-1.wav?_=2" /><a href="https://www.enter.co/wp-content/uploads/2016/09/parametric-1.wav">https://www.enter.co/wp-content/uploads/2016/09/parametric-1.wav</a></audio>
<p>Por su parte, el sistema de Google aún está basado en una muestra inicial real, pero en lugar de recortar las grabaciones, el sistema aprende de ellas e independientemente crea sus propios sonidos en una variedad de voces. De hecho, WaveNet solo conoce los sonidos de los idiomas, no su contenido. Para construir discursos con sentido, Google moldea los resultados con reglas lingüísticas y sugerencias. Así suena:</p>
<audio class="wp-audio-shortcode" id="audio-261125-3" preload="none" style="width: 100%;" controls="controls"><source type="audio/wav" src="https://www.enter.co/wp-content/uploads/2016/09/wavenet-2.wav?_=3" /><a href="https://www.enter.co/wp-content/uploads/2016/09/wavenet-2.wav">https://www.enter.co/wp-content/uploads/2016/09/wavenet-2.wav</a></audio>
<audio class="wp-audio-shortcode" id="audio-261125-4" preload="none" style="width: 100%;" controls="controls"><source type="audio/wav" src="https://www.enter.co/wp-content/uploads/2016/09/wavenet.wav?_=4" /><a href="https://www.enter.co/wp-content/uploads/2016/09/wavenet.wav">https://www.enter.co/wp-content/uploads/2016/09/wavenet.wav</a></audio>
<p><span style="font-weight: 400;">Adicionalmente, el sistema en sí no está construido únicamente para hablar. También es capaz de otras labores, como tocar el piano. Sin embargo esto podría no sorprender, porque ya existen varios sistemas que autogeneran música y no es tan complicado como crear voces humanas. Además, la AI ya<a href="http://www.enter.co/chips-bits/apps-software/la-inteligencia-artificial-de-google-compuso-su-primera-melodia/" target="_blank"> es capaz de componer música</a> por sí misma. </span></p>
<audio class="wp-audio-shortcode" id="audio-261125-5" preload="none" style="width: 100%;" controls="controls"><source type="audio/wav" src="https://www.enter.co/wp-content/uploads/2016/09/googlepiano.wav?_=5" /><a href="https://www.enter.co/wp-content/uploads/2016/09/googlepiano.wav">https://www.enter.co/wp-content/uploads/2016/09/googlepiano.wav</a></audio>
<p><span style="font-weight: 400;">Por ahora Google no tiene planeado usar WaveNet para sus productos, como Google Assistant, porque el sistema requiere una gran cantidad de energía y procesos complejos. Si quieres aprender a fondo cómo funciona este sistema puedes leer alguno </span><a style="line-height: 1.5;" href="https://drive.google.com/file/d/0B3cxcnOkPx9AeWpLVXhkTDJINDQ/view">de los dos</a> <a style="line-height: 1.5;" href="http://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45379.pdf">reportes científicos</a><span style="font-weight: 400;"> publicados.</span></p>
<p><em>Imagen: Pixabay. </em></p>
]]></content:encoded>
					
					<wfw:commentRss>https://www.enter.co/chips-bits/apps-software/escucha-a-la-inteligencia-artificial-de-google-crear-voces-realistas/feed/</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		<enclosure url="https://www.enter.co/wp-content/uploads/2016/09/googleconce.wav" length="159396" type="audio/wav" />
<enclosure url="https://www.enter.co/wp-content/uploads/2016/09/parametric-1.wav" length="168946" type="audio/wav" />
<enclosure url="https://www.enter.co/wp-content/uploads/2016/09/wavenet-2.wav" length="138642" type="audio/wav" />
<enclosure url="https://www.enter.co/wp-content/uploads/2016/09/wavenet.wav" length="157242" type="audio/wav" />
<enclosure url="https://www.enter.co/wp-content/uploads/2016/09/googlepiano.wav" length="327724" type="audio/wav" />

			</item>
	</channel>
</rss>
