Join us for an expert-led overview of the tools and concepts you'll need to pass exam PL-300. The first session starts on June 11th. See you there!
Get registeredPower BI is turning 10! Let’s celebrate together with dataviz contests, interactive sessions, and giveaways. Register now.
Necesito convertir la columna HTML en texto plano. He visto algunos tutoriales y he agregado una columna personalizada con la siguiente codificación en Power Query: Html.Table([HTML text],{{"Plain text",":root"}})
Esto no funciona para mí, ya que tengo algunas celdas vacías (nulas) en la columna "texto HTML" y provoca un error al crear e intentar expandir la tabla.
También intenté convertir la columna HTML en un texto formateado (en lugar de simple) y no funcionó.
Espero que puedas ayudarme con esto, gracias.
Hola @sardo
¿Puede proporcionar algunos datos ficticios para mostrar lo que quiere lograr? ¿Quizás quieras extraer una tabla entre etiquetas <table> del código HTML? ¿O tal vez desea eliminar todas las etiquetas en algún código HTML? ¿Tiene código HTML en la columna [Texto HTML] o tiene un archivo html en esta columna?
Saludos
Jing
Hola Jing,
Estoy conectado a Salesforce Object y este es un campo HTML.
Cuando utilizo el objeto visual personalizado de contenido HTML, me muestra los datos correctamente con el formato correcto, pero no puedo agregar más campos y necesito que el contenido se use en una tabla.
Agregué correctamente una columna personalizada en Power Query mediante el código Html.Table([HTML text],{{"Plain text",":root"}}), pero es un texto sin formato y difícil de leer para el cliente.
Espero que esto se aclare. Gracias.
Hola @sardo,
¿Puedes probar lo siguiente?
1. Antes de convertir HTML a texto, debe reemplazar o eliminar valores nulos para evitar errores durante el proceso de conversión (use "Reemplazar valores" en Power Query)
2. Extraiga texto del HTML usando el código M
let
HtmlToText = (html as text) as text =>
let
// Replace HTML tags with empty strings
Step1 = Text.Replace(html, "<", " <"),
Step2 = Text.Split(Step1, "<"),
Step3 = List.Transform(Step2, each if Text.StartsWith(_, "/") or Text.Contains(_, ">") then "" else _),
TextResult = Text.Trim(Text.Combine(Step3, ""))
in
TextResult
in
HtmlToText
3. Usa la función personalizada que has definido haciendo referencia a tu columna HTML: HtmlToText([YourHtmlColumnName])
Nota: Si la conversión da como resultado una tabla, es posible que tenga que expandirla. Espero que esto ayude.
Hola Sahir,
Muchas gracias por su respuesta.
¿Puede guiarme dónde puedo agregar ese código en " Reemplazar valores" en Power Query?