Udari Madhushani Sehwag

According to our database¹, Udari Madhushani Sehwag authored at least 4 papers in 2024.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of three.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2024

Can LLMs be Scammed? A Baseline Measurement Study.

[BibT_eX]

[DOI]

Udari Madhushani Sehwag

CoRR, 2024

AdvBDGen: Adversarially Fortified Prompt-Specific Fuzzy Backdoor Generator Against LLM Alignment.

[BibT_eX]

[DOI]

Pankayaraj Pathmanathan

Udari Madhushani Sehwag

Michael-Andrei Panaitescu-Liess

Furong Huang

CoRR, 2024

GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment.

[BibT_eX]

[DOI]

Yuancheng Xu

Udari Madhushani Sehwag

CoRR, 2024

SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal Behaviors.

[BibT_eX]

[DOI]

Udari Madhushani Sehwag

CoRR, 2024

Udari Madhushani Sehwag

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...