Publication

Visual Transformer Meets CutMix for Improved Accuracy, Communication Efficiency, and Data Privacy in Split Learning

CutMixSL

July 20, 2022

People

Praneeth Vepakomma

Former Research Assistant

Share this publication

Visual Transformer Meets CutMix for Improved Accuracy, Communication Efficiency, and Data Privacy in Split Learning

Abstract

This article seeks for a distributed learning solution for the visual transformer (ViT) architectures. Compared to convolutional neural network (CNN) architectures, ViTs often have larger model sizes and are computationally expensive, making federated learning (FL) ill-suited. Split learning (SL) can detour this problem by splitting a model and communicating the hidden representations at the split-layer, also known as smashed data. Notwithstanding, the smashed data of ViT are as large as and as similar as the input data, negating the communication efficiency of SL while violating data privacy. To resolve these issues, we propose a new form of CutSmashed data by randomly punching and compressing the original smashed data, and develop a novel SL framework for ViT, coined CutMixSL. CutMixSL communicates CutSmashed data, thereby reducing communication costs and privacy leakage. Furthermore, CutMixSL inherently involves the CutMix data augmentation, improving accuracy and scalability. Simulations corroborate that CutMixSL outperforms other baselines including parallelized SL and SplitFed that integrates FL with SL.

via FL-IJCAI 2022

FL-IJCAI-22_paper_27.pdf

Visual Transformer Meets CutMix for Improved Accuracy, Communication Efficiency, and Data Privacy in Split Learning

People

Abstract

Split learning for health: Distributed deep learning without sharing raw patient data

Supervised Dimensionality Reduction via Distance Correlation Maximization

A Fast Algorithm for Manifold Learning by Posing it as a Symmetric Diagonally Dominant Linear System

Combinatorics of Distance Covariance: Inclusion-Minimal Maximizers of Quasi-Concave Set Functions for Diverse Variable Selection

Visual Transformer Meets CutMix for Improved Accuracy, Communication Efficiency, and Data Privacy in Split Learning

People

Share this publication

Abstract

Split learning for health: Distributed deep learning without sharing raw patient data

Supervised Dimensionality Reduction via Distance Correlation Maximization

A Fast Algorithm for Manifold Learning by Posing it as a Symmetric Diagonally Dominant Linear System

Combinatorics of Distance Covariance: Inclusion-Minimal Maximizers of Quasi-Concave Set Functions for Diverse Variable Selection