Get certified for free when you join Fabric Data Days 2026 and dive into Fabric, Power BI, SQL, AI, and other essential data skills.
Join nowData Days is here! Join us now for 60+ days of learning, challenges, and connection. Learn more
Looking for someone who knows more about dataframes to confirm what exactly they are in terms of a Fabric notebook. They look and feel like a temp table that you can build and manipulate but I've recently discovered that must not be the case. I have a notebook that was going to update two tables, the primary target table Warehouse and a secondary logging table called WarehouseSource. Both tables are being updated based on changes that have happened between Warehouse and its original source so I have dataframes that start off by looking at that table, but from there I built dataframes independently that would be used in a merge statement with each table. In my final merge I was altering Warehouse first and then WarehouseSource and was running into my WarehouseSource changes not happening and discovered that after the Warehouse merge happened my dataframe meant to update WarehouseSource was suddenly empty. After some back and forth with ChatGPT it was saying dataframes in Fabric aren't actually data themselves but a query template for the data, so by changing the original source I broke my WarehouseSource dataframe. Ultimately it was an easy fix, I merge WarehouseSource first and then Warehouse and it works how I want, but it was a jarring discovery to realize that dataframes are not what I thought they were.
Solved! Go to Solution.
Hola @EricCicconetti ,
Los DataFrames no son tablas temporales ni copias de datos, sino una definiciรณn lรณgica de cรณmo recuperarlos.
Esto significa que se ejecutan en tiempo de ejecuciรณn y siempre reflejan el estado actual de la fuente. Por eso, si modificas la tabla base antes de usar otro DataFrame dependiente, el resultado puede cambiar o incluso quedar vacรญo, exactamente lo que experimentaste.
Se utilizan principalmente como motor de transformaciรณn de datos para:
Dentro de la arquitectura Medallion:
Si no estรกs trabajando con este enfoque, vale la pena revisarlo, ya que ayuda a estructurar el uso de DataFrames correctamente y evitar situaciones como esta.
Si mi comentario te ayudรณ a resolver tu pregunta, te agradecerรญa mucho que lo marcaras como la soluciรณn aceptada. Esto ayuda a otros con el mismo problema y tambiรฉn me motiva a seguir contribuyendo. Muchas gracias. Lo aprecio mucho.
Hola @EricCicconetti ,
Los DataFrames no son tablas temporales ni copias de datos, sino una definiciรณn lรณgica de cรณmo recuperarlos.
Esto significa que se ejecutan en tiempo de ejecuciรณn y siempre reflejan el estado actual de la fuente. Por eso, si modificas la tabla base antes de usar otro DataFrame dependiente, el resultado puede cambiar o incluso quedar vacรญo, exactamente lo que experimentaste.
Se utilizan principalmente como motor de transformaciรณn de datos para:
Dentro de la arquitectura Medallion:
Si no estรกs trabajando con este enfoque, vale la pena revisarlo, ya que ayuda a estructurar el uso de DataFrames correctamente y evitar situaciones como esta.
Si mi comentario te ayudรณ a resolver tu pregunta, te agradecerรญa mucho que lo marcaras como la soluciรณn aceptada. Esto ayuda a otros con el mismo problema y tambiรฉn me motiva a seguir contribuyendo. Muchas gracias. Lo aprecio mucho.
| User | Count |
|---|---|
| 8 | |
| 7 | |
| 6 | |
| 5 | |
| 4 |
| User | Count |
|---|---|
| 22 | |
| 18 | |
| 16 | |
| 15 | |
| 12 |