Altavoces separados superpuestos

Cuando dos personas hablan entre sí en una pista, esta herramienta empuja la voz dominante hacia adelante y reduce la superposición, haciendo que la conversación cruzada sea más fácil de seguir y transcribir.

Pro Herramienta IA de primera calidad — incluida con cualquier plan pagado.

🎧

Suelta un archivo de audio o vídeo aquí

o

MP3, WAV, M4A, FLAC, OGG, AAC

Limpiando tu audio...

Antes

Consejo: pulse la barra espaciadora para cambiar antes / después.


Cómo funciona

El discurso superpuesta está separado por fuente, por lo que el altavoz de primer plano está aislado de la voz y la habitación que compiten. El resultado es una pista más clara de un solo altavoz de una grabación de conversación cruzada desordenada.

Para lo que es bueno

  • Interconversación en entrevistas
  • Grabaciones de un solo micrófono en dos personas
  • Limpiando audio de debate
  • Preparación de la transcripción para la superposición

Detalles

Motor
Demucs
Formatos
MP3, WAV, M4A, FLAC, OGG, AAC
Precio
Planes de pago

Preguntas frecuentes

Aisla el altavoz dominante de campo cercano y suprime la superposición. La diarización completa por altavoz en pistas separadas está en nuestra hoja de ruta; hoy limpia la voz de primer plano.

Sí — reducir la voz y el espacio que compiten hace que el discurso a texto sea mucho más preciso en secciones superpuestas.

Grabaciones donde el altavoz de destino está más cerca del micrófono separado mejor, ya que la proximidad da al modelo una fuerte señal de primer plano.

La separación de los altavoces está construida para dos voces que hablan entre sí en una pista limpia, mientras que la extracción de altavoces de objetivos saca una voz de un lío más amplio de voces, música y ruido.

Está sintonizado para dos voces superpuestas; con tres o más todavía levanta el altavoz dominante cercano al campo, pero el resultado es menos limpio que una verdadera grabación de dos personas de conversación cruzada.

Un segmento de entrevista típico procesa en menos de un minuto, escalando con la longitud del clip en lugar de con la cantidad de superposición que hay.

Las voces de igual volumen son el caso más difícil y dejan atrás a más del altavoz competidor; la herramienta funciona mejor cuando tu objetivo es claramente la voz más cercana y más fuerte.

Instrumentos relacionados