vectorassembler

Here are 3 public repositories matching this topic...

CamilaJaviera91 / pyspark-first-approach

This code demonstrates how to integrate PySpark with datasets and perform simple data transformations. It loads a sample dataset using PySpark's built-in functionalities or reads data from external sources and converts it into a PySpark DataFrame for distributed processing and manipulation.

os pandas path kaggle curses gspread matplotlib fpdf google-oauth2 shutil linearregression pyspark-python kaggle-api pathlib pyspark-sql sparksession vectorassembler window-pyspark

UpdatedMar 31, 2025
Python

arnoldchrisoduor1 / LinearRegression-Model-with-ApacheSpark-and-DataBricks

Star

Using Apache pySpark on DataBricks, I was able to do feature Engineering on Customer Data, trained and used a Linear Regression Model to predict their bill based on previous customer trends.

apache-spark linear-regression python3 pyspark databricks-notebooks vectorassembler