feat: add regex to url before scraping (#4174)

Co-authored-by: Kuchenpirat <24235032+Kuchenpirat@users.noreply.github.com>
2025-10-27 16:53:34 -04:00 · 2024-09-27 13:02:34 +02:00 · 2024-09-27 13:02:34 +02:00 · 38502e82d4
commit 38502e82d4
parent f8cd8b00a5
1 changed files with 8 additions and 1 deletions
--- a/mealie/services/scraper/scraper.py
+++ b/mealie/services/scraper/scraper.py
@ -1,4 +1,5 @@
 from enum import Enum
+from re import search as regex_search
 from uuid import uuid4

 from fastapi import HTTPException, status
@ -31,7 +32,13 @@ async def create_from_url(url: str, translator: Translator) -> tuple[Recipe, Scr
        Recipe: Recipe Object
    """
    scraper = RecipeScraper(translator)
-    new_recipe, extras = await scraper.scrape(url)
+
+    extracted_url = regex_search(r"(https?://|www\.)[^\s]+", url)
+
+    if not extracted_url:
+        raise HTTPException(status.HTTP_400_BAD_REQUEST, {"details": ParserErrors.BAD_RECIPE_DATA.value})
+
+    new_recipe, extras = await scraper.scrape(extracted_url.group(0))

    if not new_recipe:
        raise HTTPException(status.HTTP_400_BAD_REQUEST, {"details": ParserErrors.BAD_RECIPE_DATA.value})